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AACAAAGATT 


GATAAACATG 


GTTTTATTTC ATTTACGCCA kTgGTGGATG GTGGAATCAA 


14 100 


GTCATGCTAT 


CTCAAAAAGT 


AACGATTACA 


ACAGATTCGG 


GCAAAGAAAT 


TAGAGGTATC 


14160 


ATCGGTTCTA 


AACCGCCACA 


TGTCTTAACG 


CCTGAAGAAC 


GTAAAAAGCC 


AATGGAAATC* 


14220 


AAAAATATGT 


TTATAGATAT 


TGGTGTTAGT 


AGCAAGGAAG 


AAGCTGAAGA 


AGCTGGCGTT 


14280 


GAAGTAGGCA 


ATATGGTTAG 


GCCATATAGT 


GAATTTGAAG 


TGCTTGCAAA 


TGATAAATAT 


14340 


TTAACTGCGA 


A r CATTTG AT 


AATCGCTATG 


GCTGTGCATT 


AGCTATTGAG 


GTATTAAAAC 


X4400 


GTTTAAAAGA 


TGAAAATATT 


GGCATTAACT 


TATACAGTGG 


TGCCACAGTG 


CAAGAAGAAG 


14460 


TTGG"i"l r l"GCG 


TGGTGCGAAA 


GTGGGAGCGA 


ATACGATTAA 


ACCAGACTTG 


GCGATAgcTG 




TcGATGTAGG 


tattg rrriiT 


GATACCCCAG 


GTATGTCAGG 


TCAAACGAGC 


GATAGTAAAC 




TAGGCGGTGG 


TCCAGTTGTC 


ATTATGATGG 


ATGCTACAAG 


TATTGCTCAC 


CAAGGTTTGC 




GAAAacATaT 


TAAAGATGTA 


GCTAAGGAAC 


ATAACATCGA 


AGTACAATGG 


GATACGACAC 


X*h f \J\J 




TAPAGATRrvr 


GGAAGTATTC 


ATGTCGCAAA 


TGAAGGTATT 


CCAACGATGA 


*i A "t c a 


wVl A V«UU X\9 X 


TArYirTrsrv^A 


TACATGCATT 


CTAATGTTTC 


AGTGCTCAAT 


GTAGATGATT 


14 820 


ATGAAAATTC 


T & Tf mT(*"TT 
inlvLUlvl x 


GTTACTGAAA 


TTGTCCGTTC 


ATTGAATGAT 


GAAAGTTATA 


t a a a a 


AAAATATCAT 


GTGGTAATPA 


AATCCATAAA 


TAATAAAGAA 


TCCTTTTAAT 


ATGGTAGGTT 


T A QA A 


GTTAAACAAT 


TGTPTAATTT 


TAATTCTTAG 


TCATTAGACA 


GTATCCATGT 


TAATAGGATT 


t c a a a 


A X X X X X X X X 


AATTTAAATG 


CTGAAAATCA 


ATTATGCCTA 


AATTTTGATA 


TTACAAGAAA 


X D U O U 


ATGATITTTT 


CTTAAATGTA 


ATTGCACTAA 


AAACCAAAAA 


AAGGGGAATA 


ATATACCTGA 




TATATTACAT 


GAGGAGCGGT 


GCAAATGTTG 


TTAGAAATTA 


AAGATTTAGT 


GTATAAAGCG 




AGCGATAGAA 


TCATACTAGA 


TCATATCAGT 


CTAAAAGTAG 


ATAAAGGCGA 


GAGTATTGCC 


1524 0 


ATTATAGGTC 


CATCAGGTAG 


TGGTAAAAGT 


ACATTTCAAA 


AGCAAATATG 


TAATTTGTTT 


15300 


AGTCCAACTA 


GTGGAGAACT 


TTATTTTAAA 


GGTAAACCCT 


ATAATGATTA 


TGACCCGGAA 


15360 


GAATTGCGTC 


AACGAATCAG 


TTATTTGATG 


CAGCAAAGTG 


ACTTGTTTGG 


TGAAACGATT 


15420 


GAAGATAACA 


TGATATTCCC 


niwt^i xvjv_n 


CGT AATG ATA 
inni ULr\x^& 


AATTTTCATAfS 




15480 


AAGCAATTAA 


TTAAAGATGT 


CGGTTTGGGA 


CATTATCAAT 


TAAGTTCGGA 


AGTGGAAAAT 


15540 


ATGTCGGGTG 


GTGAGCGGCA 


AAGAATTGCT 


ATAGCGCGCC 


AACTGATGTA 


TACACCGGAT 


15600 


ATTCTTTTAT 


TAGATGAATC 


GACCAGTGCA 


TTAGACGTTA 


ATAATAAAGA 


AAAGATAGAA 


15660 


AATATCATTT 


TTAAATTAGC 


AGATCAAGGC 


GTGGCAATTA 


TGTGGATTAC 


CCACAG CGAT 


15720 


GACCAAAGTA 


TGCGACACTT 


TCAAAAGCGT 


ATAACAATTG 


TTGATGGTCA 


AATTTCTAAT 


15780 
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CATTCCGATT ATCATTTCAT ATAAAGAAGG TTTACATATT ATTAAAGATT TAATTGTTGC 15900 
GACATTACGA GCAGTTGTGC AATTAATCAT TTTGGGATTT TTGCTGCATT ATATTTTTAA * 15960 

5 AATAAACGAT AAATGGCTGC TTATTTTATG TGTATTGGTC ATTATTATTA ATGCATCATG 16 020 
GAATACAATT AGTCGAG CAT CACCAGTGAT GCATCATGTG TTTTGGATAT CATTTCTAGC . 16080 

TATCTTCATT GGAACGGCAT TACCGCTTGC AGGTACTATT GCGACAGGGG CCATTCAATT 16140 

10 

TAC CGCAAAT GAAGTTATAC CTATCGGCGG CATGCTTGCA AATAATGGCT TGATTGCAAT 16200 

TAATTTAGCT TACCAGAATT TAGATCGTGC ATTCGTACAA GATGGTACTA ATATTGAATC 16260 

TAAATTATCA CTTGCAGCTA CACCTAAATT GGCTTCTAAA GGTGCAATAC GTGAAAGTAT 16320 

15 

. TCGTTTAGCT ATAGTGCCAA CTATTGATTC GGTTAAAACA TATGGGCTTG TGTCGATTCC 16380 

TGGTATGATG ACAGGCTTAA TTATTGGTGG CGTACCACCT TTACAAGCGA TTAAATTTCA 16440 

20 ATTGTTAGTC GTG TTTATTC ATACAACTGC GACCATTATG TCTGCTTTGA TTGCGACATA 16500 

TTTAAGCTAT GGTCAATTTT TCAATGCAAG ACATCAATTA GTAGCACGAA ATACTGATGT 16560 

TAAGAGTGAA TCATGATAGA TTTTACTGCA TCAGATTTAG GCATTAGTTT TAATTGGAAA 16620 

25 TGAAGTGACG CGCACATATA GTATCGCTAT TCATTAGCGC AGCGAAAATA TTCATAAAGG 16680 

CACG CATACT TTGTAGTCAG TTATCTGTTC TGACATATAA AGCGTGCGTG CTTTTTTGGA 16740 

GTTATTGTTG AAACTGAAGT AATTATACAT AATTATTAAA TGACATACTT GTGTTAATTT 16800 

30 TTCAAATACT GAAAAACAAT TTCaATAATT TTCCaATTAA GCACAGAAAA TTAAAGCAAA 16860 

ATATTATATA ATAGAACGGT TATATATaAA nATTngTgCA CACATTTTTT AATAAATCGT 16920 

TATTCTAAGG GAAATGAATA TCGGAAATTT TGTTTGAAAG GAGTTTTAAA TTGTCAATCA 16980 

35 

TGCGACTATT TACATTCATT TTAAGTATTT TTATCGTAGG AATGGTTGAA ATGATGGTTG . ■ 17040 

CAGCTATTAT GAACTTGATG AGTGAGGACT TACATGTATC AGAAG CTGTC GTTGGTCAAT 17100 

TAGTGACAAT GTACGCTTTA ACATTTGCGA TATGTGGACC TATTCTGGTT AAATTAACGA 17160 

40 

ACCGTTTTTC ATCAAGGCCT GTATTATTAT GGACATTACT TATATTTATC ATTGGTAATG 17220 

GCATTATTGC TGTAGCGCCA AATTTTTCaA TATTAGTAGT TGGTAGAATT ATCTCATCTG . 17280 

45 CAGCAGCAGC ACTAATTATC GTAAAAGTAT TAG CTATTAC AGCGATGTTA TCAGCACCTA 17340 

AAAATCGTGG TAAAATGATT GGACTTGTCT ATACAGGGTT TAGTGGTGCT AATGTTTTTG 17400 

GTGTACCAAT TGGAACGGTT ATCGGCGATT TAGTAGGTTG GCGCTATACA TTTCTATTCT 17460 

so TAATTATTGT GAGTATTATT GTTGGCTTCT TGATGATGAT CTATTTACCG AAGGATCAGG. 17520 

AAATACAACG AGGCCCTGTG AATCATGAGA CACCATCTCA TGAAAATCAT GTTACTTCGA 17580 
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CAAACTCAGT GACATTCGTC TTTATAAATC CACTTATTTT ATCTAATGGT CATGATATGT 17700 

CATTCGTTTC ATTAGCACTT CTAGTAAATG GAATCGCTGG CGTTATTGGA ACATCATTAG 17760 

5 

GTGGTATATT CTCCGATAAA ATTACAAGTA AGCGTTGGTT AATGATTTCT GTTTCTATTT 17820 

TTATCGTCAT GATGTTACTT ATGAATTTAA TCTTACCTGG TTCAGGTCTA TTGTT AG CAG 17880 

GACTATTTAT TTGGAATATC ATGCAATGGA GTACTAATCC AGCAGTGCAA AGCGGTGTGA 17940 

10 

TTCAACATGT TGAAGGCGAC ACAAGCCAAG TAATGAGTTG GAACATGTCT AGTTTAAACG 18000 

CTGGTATTGG TGTTGGAGGC ATTATTGGAG GCTTGGTCAT GACACATGTT TCTGTTCAAG 18060 

15 CTATCACATA TACGAGTGCC ATCATTGGCG CATTAGGATT AATCGTTGTT TTCACATTGA 18120 

AAAATAATCA TTATGCTAAA ACATTTAAAT CATCATAATT CTCATATGAm AAGCACGCCT 18180 

GCTATCAAAT TCAGGTGTGC TTTTTTAGAT GCGATAACGT TATTGATATG TGCGATAATA 18240 

20 GCGACGTTCA TTATGATACA TCGGCCAAGG CATTTTACCG CTTTTAGCAA AATTAGCTAA 18300 

ATCATTTTGC ATTTGTCGAC TTAAAAATTT AAGGTGaGCA GTTGTTGGaT ATgAT 18355 
(2) INFORMATION FOR SEQ ID NO: 68: 

25 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1192 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

30 . ^ . 

- <xi) SEQUENCE DESCRIPTION: SEQ ID NO: 68: 

CGCAAAGAAG TACAAAAAAT GTTTTTACAA GAAGGTATTA AAACACCTCA AC CAATT ATG 60 

35 . ■ ; 

ACTGCTTATA ATCATAGTGA AAACGgTGTT TAGTAGTTTA TAATACATGG AGGTCATATT 120 

TAATGGCGTC AAAATATGGA ATAAATGATA TAGTAGAAAT GAAAAAACAA CATGCGTGTG 180 

GAACAAACCG TTTTAAGATT ATTAGAATGG GTGCAGACAT AAGAATTAAA TGTGAAAATT 24 0 

40 

GTCAAAGAAG TATTATGATT CCACGTCAAA CGTTTGATAA AAAACTTAAA AAAATCATCG 300 

AATCTCATGA TGATACACAA AGATAGGAGA ATGATTAATG GCTTTAACAG CAGGTATCGT 36 0 

45 TGGATTGCCA AACGTTGGTA AATCAACATT ATTTAATGCA ATAACAAAAG CAGGTGCTTT 420 

AGCAGCGAAC TATCCATTCG CTACGATTGA TCCTAATGTA GGGATAGTAG AAGTGCCAGA 4 80 

TGCTAGATTA CTTAAATTAG AAGAAATGGT TCAACCTAAA AAGACATTGC CGACTACATT 540 

50 TGAATTTACA GATATCGCTG GTATTGTGAA AGGTGCTTCA AAGGGAGAAG GGTTAGGTAA 600 

TAAATTCTTA TCACATATTA GAGAAGTAGA TGCGATTTGT CAGGTCGTTC GTGCATTTGA 660 
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TAATATGGAA TTAGTACTAG CGGACTTAGA ATCTGTTGAG AAACGTTTGC CTAGAATTGA 
AAAATTAGCA CGTCAAAAAG ATAAGACTGC TGAAATGGAA GTACGTATTT TAACAACTAT 
TAAAGAAGCT TTAGAAAATG GTAAACCCGC TCGTAGTATT GACTTTAATG AAGAAGATCA 
AAAATGGGTG AATCAAGCGC AATTACTGAC TTCTAAAAAA ATGCTTTATA TCGCTAATGT 
TGGTGAAGAT GAAATTGGTG ATGATGATAA TGATAAAGTA AAAGCGATTC GTGAATATGC 
AGCGCAAGAA GACTCTGAAG TGATTGTTAT TAGTGCAAAA ATTGAAGAAG AAATTGCTAC 
ATTAGATGAT GAAGATAAAG AAATGTTCTT AGAAGaTTTA GGTATCGaAG AACCAGGATT 
AGATCgrTTA ATTAGGAmCA C t TATGAATT ATTAGGnTTA TCCACCATAA TT 
<2) INFORMATION FOR SEQ ID NO: 69: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7494 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



. (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 69: 



AATATAGCTG 


CAATAGCATC 
GCACGACACA 


TCGTTTCATT 


TGTATAATCA 


ATTCCGGTTT 


AAATATCAGT 


GTGAACGTAA 


GATTAAAAAT 


AACACTGCCG 


GAATGAGTCG 


TTTCAATCGT 


CGCTt CCAAA 


ACTCTAGCAA 


ATCGATTTTT 


TGCGTCCGAT 


AATACTCACT 


TATCAACAAA 


CTTGTTATTA 


AATAACCTGA 


AATAACGAAG 


AATGTATCTA 


CTCCTAAAAA 


GCCCCCACTT 


AACCATTGTG 


CATTCAAGTG 


ATAAATAATG 


ATTCCTATAA 


CTGCGAATGC 


CCTCAATCCA 


TCTAATCCAG 


GTAAGTATCG 


CGGGG AATAC 


ATTTTTTCTA 


AACGTTTAAA 


GTCTTTTGTA 


TCCAfCTTAA 


TAAACGCCCC 


ATTTATTTTT 


CTCTATTTTG 


TAGTATATCA 


CAATATTTTT 


GAAAATAAAA 


TATTGCACTG 


aTTTTCATTA 


ATTGATTTAA 


CCCTTAATTA 


AGATAGTTTT 


AAATTTTTTA 


TTAAGTAGAA 


AACAATTATT 


ACAGTTGATT 


TCATTACTGC 


AAACCACATA 


TAAATTTGTC 


GATTTTACTA 


CATAACATAG 


ATTATCATAG 


ATTCTTGAAT 


TTTTAGCAAA 


ATAACTGTTA 


TTTTCATTAT 


ATTTTTACAA 


AAAAAGGTTC 


GTTTTATATT 


TTATGCATCT 


TACTGTAACA 


GAATCATTAA 


GATATG CTAT 


TCGAATATAC 


TTTTTCAAAA 


TTTATATAAT 


GAATAAATTA 


ACATGTATTG 


AAAAAAAAGC 


GAAATGCAGC 


CTATCCTCTA 


ATGTAAACCA 


AACGATATAT 


CTCGTCAGAC 


TTTATATTTA 


AACGCTATGT 


GTCACTTTTA 


AAATGAATAT 


TACTAAGATT 


GTCATATCAA 


TTATTATTGC 


ATCGAATTAA 


TCTTTTAAAT 


TTCTGTAATA 
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ACGGAAGTCA TTATTAGAAT AAAAATACTG TGCACTAATA AATTTATCAA TTGTTCCTAA 1020 

ATAAATACCA TCGATATTTT GTTCTTTACA TGTCATTATA ACTTTATCTA AAAGTTTTTT 1080 

ACCTATTTTT AAATTCCTAT AACCTTTATC AACAAACATT TTTTTAAGTG CAGACATATT 1140 

ATTATCTAGT CTAATCAAAC CTATAGTACC AACAATATTT TGaTGATTGT TTATTGCAAG 1200 

CCAAAATgCC CTCCATTATT CAAATAGTTA TGTT CGATGT TCTCCAAATC AGGTTGATCA 12 60 

TCTCTATCAA TTTTTATATa AATTCATTTT TTTGAATCGA TAAAATAAAC TCGATTAGCT 1320 

CTTCCTTATA AGACCTATTA TATTCAATTA TGTTTATAGC CATTTTTATC TCCTTTTTCA 13 80 

TTTAATTTAA TTATAAAATG TGCGTTTAGT TTGTATCTAG TGTACTCAGT ACAGCCTCAA 1440 

ATGAAGTTTC ATTCCACTTG GCACTTAATA AAGACAAGTA TTTTAGCAGT AATACAATAA 1500 

AGTCCAATAA ATTTCCCTAA CTTCAATATC CACTTTTTAA AAAATGTATT TTTAATTAAT 1560 

AAAAAAACTC TCCCCAATTT CTATGGGAAG AGCTATATAT TTAATGTCTA AACATTACTT 1620 

TTATTTATTA TGAAGGAATT AGAATCCCCA AGCACCTAAA CCTTGTGCTT TGTATGCTTT 1680 

AACAGCTGCG TTGATTTGTT GGTCAACAGT GTTTGTTGGA CCCCAACCTG GCATAGTTTG 174 0 

GAATAAACCT GAAGCACCTG ATGGGTTGTA AGCATTTACT TGACCATTTG ATTCACGAGC 1800 

GATGATTGCA GCCCATGTAG AAGCTGAAAC AC CAGTACGT TGAGC CATGA TTTGAGCTGC 1860 

TGATGAACCA GTAG CACCTG CAGTATTACC ATTGCTTAAT CTCACTGAAC TTGAAGTAGT 1920 

TGAAGTGCTG TAGTTATGGT AAGTTGGAGC TGAAACAGCT TCAACGTtTG AGTTACTTGA 1980 

TTGTGCATTG TAGCTTACTG ATTGT AC ATT TGAACCTTGG TTGTATGAAG TAGTGTAGTC 2 04 0 

TGCACCTGCA ACGTTTGAGA AACCAGCAGT TTGACCATTA GCTGCTTCAT AGCTCCATGA 2100 

CCATGTAGTA CCATTTGAAG TGAAGTTATA TTGGAAACCA TCTTTTACAA AGTGGATGTC 2160 

ATATGCACCA TCTTTGATTG GAG CTGCATT TAATTGATCT TGGTGATTAT GCGCTAAGTC 2220 

AACTAAGTGT GCTTGATCAA CGTTTACTTC AGCAGCGTGT GCTTGATGTC CTGTACCTGC 2280 

TGCGTAACCT GTTACACCTA ATGC CACTGC TAATGATGAT GCCATAATTG TCTTTTTCAT 234 0 

AGTAAAAAAT CCTCCAGTAA TAATTGTnAG TTTATGTTTT TAGTAATTAT AtTTTGaATT 2400 

TGAATGTCGT AGTgCAAGTT TAAATTGTCT TTTATTTCTT TCaACGGTAC TCACTATATC 2460 

ACAaAAAACC AGCCAGTAAA TTACACTTTC TTTACAAAAC ATTACAATAT CAAGTGTTAT 2520 

TTG t AATGTT GAAATATGGC TGTTTTATAC TGTAATGTGA AATATGTGCC CTTTAGAATC 2580 

CAATCAACCC TTGAAATAGT CTTTAACACA TAAGATTTTT ACTATATTTA GCTCAACTAT 2640 

TACAG CTTTC GTAATATTAC AGATTGTATT TTTGTTACAT AGCTGTAATA TATCTGACAT 2700 
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TACACATGTA TTGATTGCTA TTATTGTTGT ATATTCAAAG TTTTAAAACA CACATCTTTT 2820 

GTGAATTGTC TTATCTTTTA TTAGCGCAAA TAAACTGCAG CTCAATTATA TTGTTCAACT 2880 

TCATTCTCGC AATTCACAAT AACATTAAAT AATTTTTGGT CTCATATTTT CAAAAAACAT 2 940 

ACTGTTATTA TCCCATGAAT TTAAAAATAT CATTAGTATA TAAACGAAAC ACTTTACGAT 3 000 

AAATGATATC TGCAAGCCAA GCTGTTACAA ATGGTACAAC AAAGAACGCT ACTACAATTA 3060 

GTAAGACACT CAACCAAGCA GAATCAACCT CCATAAATTT AAATGCATTA ATCGGTCCTA 3120 

CCATTCCTAT AAAACCAAAT CCAGCTGACT CTTTCGTTCC ATGAATACCT ACTAATGCTG 3180 

ATACCAAACC TGATACAATG GCTGTCGTTA ATATTGGTAA CATAAGAATT GGATATTTCA 3240 

CCATATTAGG TATCATCATT TTAACGCCTC CAAAGAAGAC GGATAACGGC ACCCCTAAAC 3300 

GATTCACTTT ACTTGTACCA ATTATCAATA CTGCTTCAGT CGCGGAGATA CCAATTGACG 33 60 

20 CTGATCCAGC TGCTAAACCT GTAATACCTA TCGCAAAGGC AATGGCCACA . GTTGATAGTG 3420 

GCGAAATAAT AATAAGACTA AATACCATTG AAATCAAAAT ACTCATGACA ATCGGTTGTA 34 80 

ATTCTGTAAA ACCATTAACC ATATTACCGA TGGCTGTTGT AATCATTTTC GTATACGGCA 3540 

25 ATATTAAAAC ACCAATTGCA CCTGAAATAC CGCCAACAAC TGTTGGGAAT ACAATCAATG 3600 

CCATACTACC TACGCGATGT TGAATAAGTA AAATGAATAA CACTGCAATC GCTGCTGTAA 366 0 

T CATTG T ATT AATTAAATCA CCAATACCCG TAATCATCCA AGCACCATTT TTAAACTGCG 3720 

CTGCACCGCT TCCTACATAT GCTGCACTTG CCACAACAGC AATTGCTAAT GGCGATAGGT 3780 

CAAATTTCAT GGCAACCAAT G CAC CAATCA AAGCAGGTAC TGTAAATTGA ATTGCAACGA 3 84 0 

CAACGCCTAA TAACGTTTTA AAAATCGGAT GATAATCCAT AAAGTATTTA AAAATTTCTC 3900 

CAAGTATCGC ATTAGGAACT AAACCCGCAA CAATACCTAT • GGGGACACCT - GATAAAACTC 3960 

TAAATATAAA ATCTTTGGGT GTAATTGTTT TAATTGATGT CATAATATCA TCCTTCCATT 4 020 

TATGTATATA CATCTGTATG CAAATAATAA AGAGCCTTAA GTTATAAGCT GCCACTAGCT 40 80 

TAAATTCTAA GATGTGCATG CCX2ATGTTGT TATATTTAGG CTAGCAGTAT CATCTATAAC 414 0 

TCAAGACTAT GAAAAATAGT ATATCACAAA ATTCTGAATT TTTAGATAAA, TAAATTGGCA 4200 

45 ATTTTTCAAA CATATTGTTA CAATACACTT TTATTTTATC TTCATTTTTA AAATCCATTA 4260 

ATACAATAGA AGAAAGACAT TCAAATGCTT ACCAAAAAGG TACATTATTT GTTAGGAGCG 4320 

TATCAGCaCT TACATATCAT CAACACAATT GACAATATAA TAGAAGATAC TGATAATAAG 4380 

50 TGTTAAAACA ACAGATGTTA GGTAGTGAAC AAATGATGGA AAGTAAATCC ATAGATCCAA 4440 

GAATCGTTAG AACCAAACAA TTGCTTGTCG ATGCTTTTCT TAAAATTTCT AGAGAAAAGA 4 500 
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TTTACGCTCA 


TTT OT3 PTG A T 


A A AGAAf^APT* 




Lnrl^uxvl inlUi 


WXxlxvW^.xLX 1 X 


4 620 




TAAAAGACTT 


GAATGATAAT 


X iWtVJVH>il X X 


CTAATGTCAT 


TAATGAAAAG 


GTTCTGCGTA 


A C 0 fl 

4 OB U 


5 


AT ATTTT CAT 


TTCAATTGCG 


AG* it ATATPA 

XVJ X X XV X x\ X V-X"k 


AAGATGCTGC 


aaagtcttgc 


GAATTAAATA 






GTGAAGCATT 


TTGPAAPAAA 


GPAPATPAAP 


GTATTAATAA 


TGAATTAGAA 


GATATTTTTG 




10 


CGATTATGTT 


AGAAAAPAGP 


T AT PPGG AGP 


ATCAACX3AGA 


TATCATTGTA 


AATAGTGCGA 


a q c n 


GTTTTTTAGr 


AGCTGGTATP 


TPAGGPTTAG 


CATTACATTG GTTTAACACG AGTCAAGAGA 


4 U 




r-AGrv-GATGT 


GTTTATPf2 AT 
»11 Xx\X Lunl 




CATTTTTAAT 


TCATCATATA 


GCACATTTTT 




15 


aataa AAf rf» 


v<jXx»x 1 iAul 


UAluLAiLI I 


GAAATCACTA 


TGTGACTTAG 


GTTCATACTT 


504 0 




fZTAr , Ar , Af t AA 


TAA A A TTT A A 
InAAAll 1AA 




TTGATTAGCC 


GTGTCTAGGA 


CATAAATCAA 


5100 






TCTACAATGT 


CATA 11 AG CA 


GTCGTTAACT 


GAATGAAAAT 


AAGCTTGTCA 


516 0 


20 


ITAAAAuAXA 


TAGATTTTAG 


TG ACAAG CAT 


TTTTGTTTTT 


GCGTAGTTAA 


ACAACACTTC 


5220 




AUbCAATA x(j 


TTGTTTAGGC 


AAGAAATGAT 


ATGTGCGTGT 


TTATTGGCAA 


ACGTACGACA 


5280 




TAGTAGTATA 


GTATGTCTAA 


iv ^ a a ^ iv pt* iv fn^i 

ACAACATATG 


TTGCATAGTT 


GAT ATG CGTT 


GTTTAAATAC 


5340 


25 


rr*7v Jv /■> i» rr* TV /"^/"» n 

TAAGATAGGA 


GGGATTGACG 


TGAG CGAGAC 


AGATGAACCT 


CAGGGGTTTG 


AACGCACGCA 


5400 




lAAiAIAl 1A 


AA iATTAATC 


AGAGTAGTCT 


GGGTGTAGTG 


ACATACATTA 


CAAATAAATT 


5460 


30 


AAAtj 1 t viAt-O 


I ITjAAbLAAL 


A ^» IV A TV T» A TV rp 

ACATAATAAT 


TGCTCGTGGT 


AAAAAGCGAA 


TCGACTAT CG 


5520 


AL. 1 vj I iAI 


AALlTi'lACA 


TACGTATTAT 


GATAATGTAG 


AAATCAAGAA 


AATCGACTGT 


5580 






AiuL xAxVaUl- 


CATTGGAATT 


TTAATAAGAC 


ACACGATGTC 


ATTCGACAAT 


5640 


35 


^t^^^p^"** 1 & 'p^p^p^'^p 
wi»iw-ix 1 l>wi 


x loL 1 L-xiLi 1 1 


AL-V? 1 \JA 1 x 


GTCTTATAAA 


ACAACATTGC 


AGACATGTAT 


5700 


ATP ZV & AfYT A P 




LAiLALi 1 1 Vj 


CCcATCGTAC 


TACTAGTAAA 


ATCGTGTCTC 


5760 




AAATPfPTTA 
xixixi x v. x in 


XXX X nrtl X Lv, 


ivvvuiLv XVjVv 


TGGTCAAAAG 


ACCGAGAAAC 


TAAAAACATT 




40 


ACTTAATG TG 

J^V. 4 X XkX* X W A VJ 


TTGATAAATT 


AOrATATAAA 

X\V«\>aX^ X X\ X /Wft 


AATAATCTCA 


AAATATATCA 


ACACTTGATT 


coon 
300U 




CTAAGGAGGA 


TATGAPAATA 
x n x u/iunn X x% 


TG A A A ATTTT 
X v»xvr\xix\X XXX 


AGATAGAATT 


AATCAACTTG 


CAAATAAAGA 


U 




AAAAGTAPAA 


OP A PTT A PTG 
v>laX\*v_ X XX\V_> X v7 


TAGfTGAAAA 


ACAAGAACAA 


CATGCATTGC 


GTCAAGAcTA 


bUUU 


45 


CTTAAGcATG 


ATCCGAGGAC 


AAGTATTAAC 


AACATTTTCC 


ACAATAAAAG 


TGGTTGATCC 


6060 




AATCGGTCAG 


GATGTCACAC 


CAGATAAAGT 


TTATGATCTT 


CG CCAACAAT 


ACGGTTATAT 


6120 




TCaAAATTAA 


tATTTGCTCA 


CGAGGTATTG 


CACTTAAGGT 


GCCAACTGAC 


CTCATAAACA 


6180 


50 


AAGCCCATAC 


TGATTGAAGA 


CACTAATGTG 


tCsaCCATGG 


TGCACATTAC 


GCTTCATCTC 


6240 




TGTATGGGCT 


TTTTATTTAT 


TCTTTTGAGA 


ATTTCATTTT 


AGCAGACCAA 


AAAATTAAAA 


6300 
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TGAACGACTG 


TGCCACCCGC 


TTCTTTCACT 


TTATTCACCA 


ACTGGTCAAC 


TTCTTCATTT 


6420 




GTGTTCACAC 


CTAGAGAAAT 


CATCACTTCA 


TTTGGTTCAG 


TATTAAGGCT 


TTGCTGACTT 


6480 


5 


ACATTTTGAA 


AATGCTTGTn 


TTCTATTAAA 


ATTACGGkTG 


t TTGAC CTAT 


tTGAATGCCG 


£ CA f\ 




ACCATTTTAT 


CTAACATTTG 


TGGGTTTCTA 


TTTATTTTAA 


ATC CTAACGC 


TTTATAAAAC 


£ C r\r\ 

ooUU 


10 


TGTGCGCTCT 


TTTCTAAATC 


TTGCACATGC 


AAATTAAACC 


ACATTGATTG 


AATCATGATT 


6660 


GCACCCCATT 


CATTACTTAT 


TATAGTTTTG 


GACTTTAAGC 


GAATCACTTA 


ATGATAATCT 


6720 




TGTTGGATTT 


ATTTCAGCCA 


TTAATTCAAA 


GTCTACTTCA 


TAACd"TTTT 


CTTCCAACCA 


6780 


15 


TTGCTTTTCT 


GCAACACCAC 


TAACAAATTC 


TCCTTCTATA 


ACAGTAGATT 


TACCTGTCAC 


6840 




TTCACTAAAA 


ATTGTTGCTG 


CTTCACTTAA 


TGTAACTTCA 


TCGGAACCAA 


TCTCTATTGA 


6900 




TTGATGCGTA 


AAGCTTTGTG 


GATGTGCAAA 


AATATACGAT 


GCAATTTTAG 


CTATATCAAT 


6960 


20 


AGAAGAAATC 


ATTGTGAATT 


TTATATTCGG 


ATTAATAAAT 


TCTGGTAATG 


TAATACGTTC 


7020 




ATCTTCGACT 


TTAGCAATGC 


GTAAAAAATT 


ATCCATAAAG 


AATGATGGTT 


TGATAACTGT 


7080 




TGCATTTATA 


TTAGATTCCA 


TTAATCTATT 


TTCTATTTTT 


GCTAGTACTT 


CAAAGTGTGG 


7140 


25 


GCCAGTTCGA 


TTTCGATTAA 


CCCCTCCCGC 


AGTACTATAC 


ACAATATGTT 


GAATATTTTC 


7200 




TTGCTCAGCT 


ATTT CAATT A 


TCTTCATACC 


TTGTCTTAAT 


TCTTCGCTAA 


CATCATCTTT 


7260 




AACGATTGGC 


TGAATACTGT 


ATAAGCCATA 


CTTAC CTTTC 


ATCGCTGATT 


GCAAACTAAC 


7320 


30 


ATTATCACTC 


AGATCACCTT 


CArCGATTGA 


TAAATGCGGA 


TGTCCTATGT 


CTGAAAGTTT 


7380 




ACGATTATnC 


TT ATTT CT AG 


TTAATGCACT 


TACATACCAT 


CCATCCTCTA 


ACAACTGTTT 


7440 




TACAACTGCA 


TTACCTTGCT 


TCCCTGTTGC 


GCCTATTACn 


AAAATATCTT 


TCAT 


7494 



35 

(2) INFORMATION FOR SEQ ID NO: 70: 

SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 11802 base pairs 

(B) TYPE: nucleic acid 
40 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 70: 

AATTTATTTC GCCGTCCCAC CCCAACTTGC ATTGTCTGTA GAAATTGGGA ATCCAATTTC 6 0 

TCTTTGTTGG GGCCCcGCCC CAACTCGCAT TGCCTGTAGA ATTTCTTTTC GAAATT CTCT 120 

GTGTTGGGGC CCCTGACTAG AATTGAAAAA AGCTTATTAC AAGCGCATTT TCGTTCAGTC 180 

AATTACTGCC AATATAACTT CGTAGATCAT AGAACATTGA TTTATTTCCC AGCCTATTCT 240 



55 



507 



EP O 786 519 A2 



AGCAAAGGTA ATAATGATAT TAATAATGf A 

TAAAACATCA GAACCACTAA AAACAAAAAA 

5 

GACCACTTTT CAAAAAAATC TCtTTTCaTa 

TTATATTCTC TTTTAAGTTT ATTATTCAAA 

ATAAACATTT CAACTACTTT TAAAAACCAA 

10 

ATAAGTGAAC ATAGTTCTTT AGTTATAATA 
GCAATTGGTT TTCATTTCCT CTTAAAGATA 

y5 CTATATTTTT CAACTTATCT CTATATTTAT 

CCTCTTCTTC GTGAGTTAAT AAATGAAGCA 
TTAAATTCGG TTTTAAAATA TGCAAATCAT 

20 CTCGTTTTAA TTCAATTTCC ACACGCCATA 

TATCTTTACG TTCTTGTTTT TATTATAAAT 
AAAATATTTT GTTTCTGGTT TTACATTACG 

25 

ATCTGACAAT GCATAATAGT CATTTAAATC 
CGTAAAACTA AGATCGTCCA AATAACTGAT 

ATG CGAAAGC TTATTAGGAT TAAATTCAAC 

30 , 

TTTATTTTGT CATATTCAAT ATAAACTTTT 
TGTAAAATAT CCCAAAGCCG AATTTCAGGA 
35 GCGTTAGACA TGCTAAGATT CCCAACAATC 

GCTAGTGACA TCCTATGTCG ATTTAACCGG 
ACAAATGGAT GAAACGAAAT TCAAAACACT 

40 

TACCATTATG TTCCTACTAA AAAACyAAAA 
TAGGATACTA TGTAATAAAA ATTTACAATA 
GmATACCCAT ACAAAGAGGA TAAAATAAAA 

45 

CTCGAGGTTT AAATATTGGT GCCTTATTTA 
TCATTAACmt AATCCTTAAA GAGTTTTAAA 
SO TCATCAACTT TTAAATAATT CAATAATTTT 

AACTTTAATA AACTATTCAT TTTGACAGGA 
AATACTTTCT CGCTTTAnAC AAAnACAAAA 

55 



CAAAAAATAT AAATCAAATC GACATCCTTA 360 

GCACAAAATA AAATTAAATT TAAAATAAAC 420 

TTTCCACCCC TAATTTTAAT AAGCATTATT 4 80 

AGGAAAACAG AAATATCTTT CaATATTATT 540 

CAAAAAAATA CTTATTTTAA GTAGATGAGC 600 

ATTAATTCAA CCAAAAGTCG ATTTGTTTTT, 660 

TTTTCATTAA ATCTGTCAAA TCAATAGACG 720 

TTTTAGTACG TCTTTCTAAA TTTCCCCATT 780 

TTGCTCGTTC TTGTATATTT TCAATCATTT 840 

CAAAACAATC TTTGCAACAA TCAACCATAT 900 

GAAATGTTGA ATCAATTTCA ACATCTGCAT 960 

CCGAATAAAC CTATCACTAT TACGCACACC 1020 

TCCATAAAAT ATAGTTTTCT TTACCGACTT " 1080 

AAATTCAAAA TCAAAAGCCA AATCTAATCT 1140 

GATATTTTGT TTTAACCAAA GCACTTCATC 1200 

GCGCATAtAC GTCTATTCGA AAGAGTTGCT 1260 

TCTTTAAGAG CTTTAGCTTT AAAGTTTGTT 1320 

TTAGTACTCA TAAAATGTGA AAGTCTCTCT 1380 

GTTATAGCGT CAAAAGACAA TTTTGGAATA 1440 

CTATTACCGG ATATTAGAGT ATCCAGTTTT 1500 

AAAAAATATG TTCCACTAAC AGCAAAAAAA 1560 

ATACTGGAGA ACAAATGTCA GGATATAACT 1620 

AAAAAACAGG AAAACAAATT TCAAGTAAAA 1680 

AACCTCGAAC TGaAATGATG ATCTTTTCAG 174 0 

TATAGATTCG TTATATTATA TTCTCTATTT 1800 

TTAATAGCTG CTAGATG ATT CAAAAATGTT 1860 

TGTGGTGTCA GTAAATnTCT ATCAAAATAC 1920 

CGTGACATTT CAATCACGTC GTCTAAAGAT 1980 

ACTTACCCGA TTAAAATCAA GTAAGTTTTA 204 0 
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TATTTGATAA AAAATCAATA AGTAATTGTG CGCCTTCAAC TTGAATATCT TTTACAACTG - -2160 

GCGCGTCGAT ATACATATCA TACTGACCAC CGCCTACTGC ACGATAATTA TTTACACAAA ■ 2220 

5 

TTGTATATGT CTGCTTTAAA TCAACTGCGT GACCTTGAAT CATGATATTG CTCACACGTT 2230 

GTCCCTTTGG TCTTCCAACA TGAATGGTAT AACTTACGCC ACCATATATA TCATAATTAA 2340 

AGTGTTGTGG TTTGGGTTCA AGGAAGTCTG CGCTCACACT AACTTCATCA TTTTTCACGT 2400 

10 

- f CAAAATATTC TGCTGATCGT TCAATGGCTT CTTTAAGTTT GGCACCACTT ACAGCTAAAA 2460 

CTTTAAATGT ATTTGGAAAT GGGTAATTGT TAATAACATC TCGCATCGTC ACGACTTGCT 2520 

15 TGAAACCACT AGCAGAATCA AACAAAGCTG TACAGGCAAC ATCTGCGTCA CTTTTTTCTA 2580 
ATAAAGCGTA ATTCATAAAA TTTGTAAAAG GATGCGGTGC CACACGTGCC TCAAATGCAT . 2640 

GATTAATCGT CATATCATAT GGCAATGTAG TAATTTCGTA ATCTAACCAG TCCTCTAACT 2700 

on 

GCTTTCGTAA ATGTTGGTCA TCTTCATCAA TAGTAAATGT GGAATCATCT ATAACAGGAA ' 2760 

GTAATTCACA TGATTCAACG GAT AGATTTT CATATTCATC AGTACTCAAG ACTACTCTGC 2820 

CTACAGTTGT ACCTCTCGTA CCAGGTTGAA TCACAGCCGT TTGCTTAAAC CTTTCAGCAA 2880 

25 

TTTGTGGATG TTGGTGACCC GTAATAAAGA TATCTATATC TTTAGAAAAC GCTTCTAACA ; 2940 

TGGCATATCC TTCATTTTCA CCCGTTAATA CTTCGGTCGG CGTACGACTT" TCTAAATCCT 3 000 

30 TTTCAAATCC ACCATGGTAA CAAACCACAA TGATATCTGC , ATGTCGCTTC >■ ATTTCAGGTA 3 060 

AGTATTGTTG AAGTATTTCA AAAGCACTAT GAAACGTArT GnCnTGAATA TGCTCTGGTT 3120 

GTTCCCAATG GGGAATAAAT TGTGTCGTTA AACCTATCAC ACCAACAGTT TGATCTCCAA 3180 

35 CCTGAAAATA CTTCACACCG TT AT CAGT CA ATGTACTATC ATTTTCATAT . ATATTAGCGC .3240 

ACAAAACTGG ATAATTGAGT CTG CGTAAAG TGTCTTTTAA GTATGGTAAT CCATAATTAA 33 00 

ATTCATGATT ACCAAG CGT A CCAAAGTCGA ATGCCATTCG ATTATAAAAA TCAACTAAAG 3360 

40 

GCTGGCTACT GCCGCTATGC GCGATTAAGT AATTACAAAA TGGTGACCCT TGCAAAAAAT 3420 

CAC CATTATC TATTTTAAAA CTTTGGT CAT ACTGCCTTCT GTsTTGTTCT ATAACATGAT 3480 

TCG CTAGTAA CAATCCCATA GGTTGATATT GATTTCTACT CGTAAAATCT GTTGGGAAAA - 354 0 

45 

TATAACCATG TACGTCACTC ACGACATJVAA ATGCTATGTT - TGACATCCTC ACTCACTCCT 3600 

TCAATCACAA ACATCTTTCT TATTTCTATT ATATATTTAT TTGAAGTCTG TTGTAATCAA 366 0 

so GGTTTTGTCA CCGAGTTTTA AACGAAT CTT TGAACCTTCC ATACTTTCAA GTACTTTAGC 372 0 

ATTGACCTTA ATTGTGACAT TTCCGTTTTC ATCTGCTTTA ACTGTTGGCA AAGTACTGTA 3780 

ACCTGGTGGG TTATAATCGT TATCTTTACT TGAAAATTGT CCGATTTGAC GTCCGCCTTC 3 84 0 
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TATTGTCATT TCAAATGGCT CATTTACAGA AACATTTTGC GGGATATCAA ATGTTACTTT 3960 

TTCGTTCTGA TTTGGTGGTG TATGATGATC TGGTGTGTTT GGCTGAGGAT CTGCGCCTTT 4 020 

5 

TTCGCTGCCA TAACTACCTG CTTTAAATGT TGTTGGATCA TACCATTTAT AACCACTCGG 4 080 

CGGTTGTGAC CATGGCTCTT TTTCAGGCTC AGTTGAACGC TCTGGTCGTT CAAAATCAAG 414 0 

CAACTTAGTC TTTGTATCTA ATGTTAGGCT ACTCGCCTTA AGTGATTTCC CATCATTATC 4200 

TTTAGACATC CAAGCCGTTA TATTATTTAA TAGCTTACCG TTGTCTTGTT CTTTAAAACC 4260 

ATCATATGTT TTCTTCTTTT CTCCATTATC TTCTCTTACA TATTTGGGCG AACTATCTTC 4 320 

1S CACAAGTGAT GAATCACCGA TAAATGCTGC TTTACCTTTT CCAACTTTAG AAATTGCTAC 4380 

ATAGGGGCCT TCTGCTTTAC CGCCCCCATT ATAAATACCT TGATCTACAG CATGTGACCA 4440 

TTTACTTTTC GCTGGCAATT GTTCTGGTGT ATACACAATA CCTTTTGCTT TCTCTGGATT 4 500 

20 

AGTAATTGCT AATGTCGATC CGGCATGCAT AGAGACAGAT TTCACACCTT CAGTAATACC 4560* 

GAAACTTTCT TTTGAAGAAA CAATATTGCT CGTATTTAAA TCACCTAGTG CATTATATCG 4620 

AAAACGTACG CCAAAGTTTG TAGATAACCA ATCTGAACTT TTCACACCTT GCATTGCAGT 4680 

25 

AGAACTTTTT TCTTCTGCAT TCATACCTTT CGACATATCT TCATATGCTC CACGTCGATA 4740 

ACCATTCATT GCCTCCGATG AATCAATACG ATTTAAATTT CGGTCAGCAT TGTAATGATC 4800 

30 TGAAATAAAG ACAACATTGC CACCTTGTTt CACATATTTA ACAATTGCTG CCTGTTCTGA 4 860 

TTCTTTGAAA GGAATGTTAG CCTCAGGAAT TACAAATATT TTGGAACTTT TCAAACTTGC 4 920 

TTCTGTTATG TTCGAATGAC CATCAATAGC TTTAACGTCA TAACCTTGTT TTTGTATTGA 4 9 80 

35 ATCCGCATAA TCTGAAAATG CACCATCACT AACCCAATCT GCAGCACCAG CTGTTTGACC 5040 

ATGAGAACGA TCGAATAATA CCGTTCGCTG TTG C TTTGTA GGTTGCGATT CATGCGTTAT 5100 

AGCHVAAGAT TGCGGTAAAG CACTTAATGA TACCGTTGCA ACAATTGCAG AGACAGTTAA 5160 

40 

TGACTTATAT ATTTTTTTCA TTTTGTGAGG CTCCTTTTAA AATAAATTTG TTCTTGAATT 5220 

ATAGGATAAA AATTCGTTGC ATATGAGCAA TTTAACGAAA AATTTACAAA ATCTTATCAA 5280 

4s ACTCTTAAAG AAAGTTATTA AAATTCATTT TTATAAAATA CTTTTTAACA TTTAAATGTG 5340 

GTACGCTATA AGTGTAATTT CATTGCATAC ATATTACACG ATTAAGAATG TGAAGGGGAC 54 00 

AGTTATCAAA TGAAAAATTT TAAGTGTTTA TTTGTATTAA TGTTAG CAGT CATTGTTTTT 5460 

SO GCAGCAGCAT GTGGAAACTC AAGTTCTTTA GATAATCAAA AGAACG CT AG TAATGATTCG 5520 

GATTCTAAAT CAGGAGGATA CAAACCTAAA GAATTAACCG TTCAATTTGT ACCTTCGCAA 5580 

AATGCTGGAA CATTAGAAGC TAAAGCAAAA CCATTAGAAA AATTACTATC TAAAGAATTA 564 0 
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TCTAAAAAAG TTGATGTTGG TTTCTTACCA 
AAAGCAGCTG ATTTATTATT ACAAGCACAA 
5 AGTAAAGAAC TTGTAGATAG TTATAAATCA 

AAAAGCTTGA AAGATTTAAA AGGTAAGAAA 
GGATATACAT TCCCACTTGC GATGTTAAAA 

10 

ATGAAAATTG TGAATGTTAA AGGTCATGAC 
GTAGATGCTG CGGCTGTATT TAACGATGCA 

f 5 GTATTTAAAG ACACACGAAT TTTAAAATTA 

GTAAGACCAG ATATGGATAA AGATTTTCAA 
GCTAAATCAA AAGAAGGTCA CAAAATTATT 

20 GAAACGAAAG ATTCAAATTT CGACATTGTA 

AAATAATCAT TATTTAACAA ATGAATCATT 

ATAGATATAT TCTAGATTAA TATTGAAAAG 
25 / 

GGTGTCGCTG TACATTTGAA ACCATTTGTA 

TTTACCTTGG CTTTTCTTTA TTAAAGAAAG 

AACGTCAGTA AAGTCTATCC TAACGGTCAT 

30 

GAAAAAGGTG AATTTGCAGT TATTGTCGGA 
AGATCTGTAA ATCGTTTGCA TGATATCACG 
35 ATCACTAAAG CCCATGGTAA AGCATTATTA 

CAACATTTTA ATTTAGTTAA ACGGTCAAGT 
GGTTATCACC CTACTTGGAA AATGGTATTA 

40 

GCAATGGATG CACTAGAACG CGTCAATATC 
TTATCAGGTG GCCAACAACA ACGTATATCT 
ATTATTCTTG CAGATGAACC AGTTGCTTCA 

45 

GATGATTTAA GAAAAATCAA CCAAGAATTA 
GTTGACTTGG CAAAAGAATA TGGCACACGC 
50 TATGATGGTC CTGCATCTGA AGCAACAGAT 

ATTAAAGAAG ATGAAAAGCT AGGAGTGAAC 
TGACTCCCTT TTAAAGAAAA AGGTTTCTTT 

55 



CCAACGGCAT ACACATTAGC ACATGATCAA 5760 

CGTTTCGGTG TAAAAGAAGA TGGTTCAGCA "5820 

GAAATTCTTG TTAAAAAAGA CTCAAAAATT , 5880 

ATTGCCTTAC AAGATGTAAC ATCAACTGCT 5940 

AACGAAGGAG GTATTAATGC AACTAAAGAT 600 0 

CAAGCAGTTA TCTCATTATT AAATGGAGAt 6060 

CGTAATACTG TGAAAAAAGA CCAACCAAAT 6120 

ACACAAGCTA TTCCGAATGA CACAATTTCT 6180 

GAAAAATTGA AAAAAGCTTT TATAGACATT 6240 

AGCGAAGTTT ATTCACATGA AGGATACACA 63 00 

AGAGAGTACG AAAAATTAGT TAAAGATATG 6360 

AGCGAATTTG GTATTAAAAG CTTTCGTTCA 6420 

CTAGGCGCTA AACTGAAACA GATATAGAAA 6480 

CACAGAAACC CAATGTCTAT GATATTTCAG 6540 

GTGTCAAACA TGAGTCAAAT CGAATTTAAA 6600 

GTAGGCTTGA AAAATATTAA CTTAAATATT 6 660 

CTATCTGGTG CTGGGAAATC CACGTTATTA 6720 
TCAGGTGAAA TTTTGATCCA 'AGGTAAATCA J " 6780 

GAAATGCGCC GAAATATAGG * TATGATTTTC 6840 

GTATTACGAA ATGTACTAAG TGGACGTGTA 6900 

GGTTTATTCC CAAAAGAAGA CAAAATTAAG 6960 

TTAGATAAAT ATAATCAACG CTCTGATGAA 7020 

ATTGCACGTG CGCTATGCCA AGAATCTGAA 7080 

TTAGACCCAT TAACTACGAA ACAGGTTATG 714 0 

GGCATCACAA TTTTAATTAA TTTACATTTT 7200 

ATCATTGGTT TACGTGATGG TGAAGTTGTC 7260 

GACGTATTTA GTGAAATATA TGGACGTACA 7320 

TAACATGCCT TTAGAAATAC CTACAAAGTA 7380 

AAAAACGAGT TTTACCTTCA TGTTAATCAT 7440 



511 



EP0 786 519 A2 



AATACCTCAA ATAGGTGATC TATTCAAACA 
ACAAATTACA ACGCCAATGT TAGATACCAT 
5 TAGCATCGTT TCAATACCAA TTGCGTTATT 

GATTTCAATA CCCTCGCGCT TTATTTTAAA 
AGCAGCAATC TTTGTGGGTG TATTTGGAAT 

10 

TATTTTAACT ATCTG TATTA TTGGAAAATT 
AGGTCCAATG GAAGCAATGA CGGCTGTTGG 

1$ TGTTGTACCA CAAGCCATAT CGTCATTTAT 

TATACGTGCT TCAGCTGTGC TTGGATTAGT 
TCAAACACTT GGTTTATTTC AATATCCAAA 

20 TATCGTCGTC GTCATTGATT ACATCAGTAC 

GAAATAGCAA AATATAATGT TCACACAAAA 
CTTATTGCAA TTGTCGTCTT AGCTATTATC 

25 GAACTTAAAA GTAAATCATT AGAAATCTTA 

GATATCAGCT ATATCTATAT ACCAGATGGC 
TTTGGGATAG CCGTTGTAGG TACTTTCATC 

30 

CTAGGTGCAA ATAATATGGT AAAGCTACGC 
AGTGTTATAC GTGTCTTCCC AGAAATTGTA 

35 CCAGGTTCAT TTTCAGGTGT ATTAGCTTTA 

TTTTAGCTGA AGATATTGAA GGTCTAGATT 
GTGC35AATAA GATTAAAACA CTCGTATTTG 

40 TATCACTCAT ACTTTATCGC TTTGAACTAA 

TTGGGGCTGG TGGTATCGGG ACACCACTCA 
GTGTAGGTAT TATATTAATC GGTTTAGTAC 

45 

GTTCAATCCG AAAACGTATT GTTTAACATT 
ACCGTCTTAC GTTTCTCTAT TATAATAAAA 
AACTTCACTG CTGTTTTTAT AATATCTAAA 

SO 

TTTACCGAAC TCTGGTAATG TTACGTTGAA 
GAATGTAGTA TCACTTTCTA GTGCATGACC 

55 



AATGATTCCA CCTGATTTCG AGTATTTACA 7560 

TCGAATGGcT ATCGTAAGTA CAGTATTAGG 7620 

ATGTGCTAGC AATATCGTTC ATCAAAAGTG 7680 

TATAGTtCGT ACTATTCCAG ATTTGTTATT 7740 

CGGTCAAATT GCAGGGATAT TAGCACTGTT 7800 

ATTATATGAA TCATTGGAAA CGATAGATCC 7 860 

CGCTAATAAA ATAAAATGGA TTGTTTTCGG 7920 

GTCATACGTA TTATATGCAT TTGAAGTAAA 7980 

CGGCGCTGGC GGTATTGGAT TGTTTTATGA 804 0 

AACAGCAACG ATTATTTTAT TTACTTTAGT 8100 

GAAAGTGAGG GCACATCTCG CATGACACAG 8160 

GCACACAAAC GAAAATTGAT TAAAAGATGG 8220 

AtCTGGGCAT TTGCAGGTGT ACCAAGTTTA 8280 

AAATCCATAT TGAGCGGATT ATTCCATCCT 8340 

GAAGACTTAT TACGTGGTTT ACTTGAAACC 84 00 

GCCGCAATTA TCTGTATTCC ATT AG CATTT 8460 

CCAGTTTCAG GTGTTAGCAA ATTTATTTTA 8520 

ATGGCACTTA TATTTATCAA AGCTGTTGGC 8580 

GGTATCCATT CCGTAGtATG CTTGGGAAAC 864 0 

TCAGTGGTGT AGAATCATTA AAGGCCAGTG 8700 

CAGTCATACC ACAAATTATG CCTGCCTTTC 8760 

ACTTACGTTC AGCTTCTATA CTGGGGCTAA 8820 

TATTTGCCAT TCAAACACGT TCTTGGGACC 88 80 

TAATGGTCGC AATTGTCGAT TTAATTTCCG 894 0 

AAATCAGGAT ACTC CTAAAT AAGAAGTCCT 9000 

ACAGCAGTGA AGAAAACTAT TGTTATAGTT 9060 

TTTATTCTAT TTCAATTCCT TTAAATAACT 9120 

ATTATCTGCT ATAGTTGCAC CGATAGAACT 9180 

ACCTTTAAAT TTCGGACTGT ACATAATTAC 9240 
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TGTAATAATT 


ACTAAATCGT 


CTTCTTTTAA 


GTTGCTAAAC 


AGTTCTGGCA AGCGATCATC 


9360 




GAAATCTTTA 


ATTGCTTGTG 


CATAACCTGG 


TTTATCACGA 


CGATGACCGT 


ATAATGCATC 


9420 


5 


AAAGTCTACT 


AAGTTTAAGA 


AGCTAATACC 


TGTGaAATCT 


TTCTTAACAA 


TTTTCATCAA 


9480 




TTGATCCATA 


CCGTCCATGT 


TACTCTTCGT 


ACGAACCGCT 


TCTGTTACAC 


CTTCACCATC 


9540 


10 


ATAAATGTCA 


TTAATTTTAC 


CGATGGCAAT 


AACATCATAA 


CCACCGTCTT 


TCAAATGATC 


. 9600 


TAAGACAGTT 


TTACCAAAAG 


GTTTTAACGC 


ATAGTCATGT 


CGATTAGATG 


TACGTGTAAA 


9660 




GTTTCCTGGT 


TCACCAACAT 


ATGGACGTGC 


GATAATACGA 


CCAATTAAAT 


ATTTAGGGTC 


9720 


15} 


TTTTGTCAAC 


TCACGAACCT 


TTTCACAAAT 


ATCATATAAC 


TCTTCTAATG 


GGATAATGTC 


9780 




TTCATGTGCA 


GCAATTTGCA 


ATACTGGGTC 


TGCACTTGTA TAAACAATTA 


AGTCACCAGT 


9840 




TTTCATTTGG 


TGCTCGCCCC 


ACTCATCGAT 


AATTTGCGTA 


CCCGATGCCG 


GTTTGTTAGC 


9900 


20 


AACAACTTTA 


CGACCTGTCA 


TTTCTTCAAT 


TTGTTGAATT 


AACTCTTCAG 


GGAATCCATT 


9960 




AGGGTATACT 


TTAAAAGGTT 


G CAT AAT ATT 


TAATCCCATA 


ATTTCCCAGT 


GACCAGTCAT 


10020 




TGTATCTTTA 


CCAACTGAAG 


CTTCACTCAA 


TTTAGTATAG 


TATGCTTCTG 


GTTGTTCAAC 


10080 


25 ' 


TG CATTTACT 


ACTGGTAATT 


TATCGATGTT 


CCCTAGACCT 


AACTTTTCAA 


GGTTTGGTAA 


10140 




AGTTTG AT CG 


AAACCTTCTA 


AGGTATGTCT 


TAAAGTATGT 


G AAC CTTCAT 


CTTTAAAATC 


10200 


30 


AGCTGCGTCT 


GGCGCTTCAC 


CAATACCTAC 


TGAATCCATT 


ACGATTAAAT 


GTACACGATT 


10260 


AAATGGTCTT 


GTCATAGCTA 


TCACTCCCAA 


AATTTATATA 


TATTAGTAAT 


CTGAATCTGC 


10320 




TTCTAAACCT 


TG CAT AATTT 


GAACACCTGC 


GCTCGCACCA 


ATACGTGTCG 


CACCTGCTTC 


10380 


35 


AACCATTTTA 


TTGAAATCTT 


CTAAATTACG 


TACGCCACCT 


GATGCTTTTA 


CTTCTACATC 


10440 




AG CACCTACT 


GTATCTTTCA 


TT AATTT AAC 


GTCTTCTGCA 


GTCGCACCGC 


CACCTGCAAA 


10500 




ACCfGTTGAA GTTTT AACG A AGTCCGCACC 


AGCCGCTTTT 


GTTAATTCAC 


TCGCTTTTAC 


10560 


40 


AATTTCGTCA 


TGGTCCAACA 


ATACCGTCTC 


AATAATCACT 


TTTACTGTGT 


GACCTTTCGC 


10620 




AGCTTTAACC 


ACTGCTTCAA 


TGTCTTGTTG 


TACATCATCA 


AAACGTCCAT 


CTTTTAATGC 


10680 




GCCGATGTTG 


ATGACCATGT 


CAATTTCATC 


TGCACCATTT 


TGAATTGCAT 


CTTCTGTTTC 


10740 


45 


AAATGCTTTC 


GTTGCAGTTG 


TCGACGCACC 


TAATGGGAAT 


CCTATTACCG 


TACAAACGAG 


10800 




CACCTCTGAA 


TCAGCTAGTC 


GCTCTGCTGC 


ATATTTAACA 


TGTGTTGGAT 


TCACACATAC 


10860 


50 


AGATTTAAAA 


TTGTATGctT 


TCGCTTCATC 


GATGATTTGA 


TCGATTTGCG 


TACGTGTTGA 


10920 


CTCAGGCTTC 


AATAAAGTGT 


GATCTATATA 


TTTCTCAAAT 


TTCATACTTA 


CTACTCCTCG 


10980 




TGTTATATAA 


TCTCTTTATT 


TAATTTTACT 


ATAAATACGA 


ATATATCTCG 


CGAATTTATA 


11040 
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10 



ATACTCATTA AACCTAAAAT AATTAAAATA ATACCGAAAT GTGAACTTAA TGCATCATTG 11160 

CCTGGGAAAT TTAATGCTTT AAAATCGATT AGAGCCGCAG CAATCGCAAT ACCTACAGAT 11220 

ACCGCCACAT TAATAATTAA ATTATAAAAA CCAATAGCCA CACCTGTCAT ATTAAGATCT 112 80 

ATTGTTTTAA TGGCTTCGTT AAGTAAAGGT GCATACATTA AAGCAAAGCT ACCTGCAAAG 1134 0 

AATATCATAG AAATGACGAA GATTGAAATG TGATTACCTA CTG CAAATG C AGGTAAAATC 11400 

AAGCTCAGTG CTATTAAAAT AATTGCTGTG ATAATCGCTT GTTTTGAATT CAGATATTCG 114 60 

CCGATTTTAC CACTTAGTGC ACCAACAATG ACTGCTACTA TATAACCCGG TACTAATAAC 11520 

75 AGTGATGTTG TGTCTAGTTG CAGATGATAA ATTTGCTCCA TTATGAATGG GAACGTAAAA 11580 

ATATAACCCA ATTGGATAGC ATACATTACA AATACTATAA ATAAAAATGA AGCATAACGT 11640 

TTATTTTGGA AAAATGATTT ATTTACTAAT GGACGTTGCG CATTTTTAAT ATATAGCGCA 11700 

AAAACGATAA TCGCAATTAA GGCACCAATC ATATATAACC AATTAAAGTT CGTAATAAAC 11760 

AGCATGACTG TTGTAGCAGG GGATCCTCTA GAGTCGAnCC TG 11802 
(2) INFORMATION FOR SEQ ID NO: 71: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1196 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 71: 

CTAAAGAAGA TGCGAAACAA GATGTTGATA AACAAGTTCA AGCTTTAATT GACGAAATCG 60 

ATCAAAATCC AAATCTAACA GATAAGGAAA AACAAGCACT TAAAGATCGT ATTAATCAAA 120 

TAC&CAACA AGGTCATAAC GACATTAACA ATGCGATGAC AAAAGAAGCA ATTGAACAAG 180 

CAAAAGAACG TTTAGCGCAA gCATTGCAAG ACATCAAAGA TTTAGTGAAA GCTAAAGAAG 24 0 

ATGCGAAAAA TGATATTGAT AAACGTGTAC AAGCTTTAAT TGACGAAATC GATCAAAATC 300 

CAAATCTAAC AGATAAGGAA AAACAAGCAC TTAAAGATCG AATTAATCAA ATACTTGAAC 360 

AAGGTCATAA CGACATTAAC AATGCG CTGA CTAAAGAAGA AATTGAGCAG GCAAAAGCAC 420 

AACTTGCACA AGCATTGCAA GACATCAAAG ATTTAGTGAA AGCTAAAGAA GATGCGAAAA 480 

ATGCAATAAA AGCCTTAGCT AATGCGAAgc GTGATCAAAT CAATTCAAAT CCAGATTTAA 54 0 

CACCTGAGCA AAAAGCAAAA GCGCTCAAAG AAATTGACGA AGCTGAAAAA CGAGCACTAC 600 

AAAACGTTGA GAATGCTCAA ACTATAGATC AATTAAATCG AGGATTAAAC TTAGGTTTAG 660 
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TTGAAGCAAC ACCTGAGCAA ATCCTAGTTA ATGGTGAACT CATTGTACAT CGTGATGACA 780 

TCATTACAGA ACAAGATATT CTTGCACACA TAAACTTAAT TGATCAGCTT TCAGCAGAAG 840 

5 TCATCGATAC ACCATCAACT GCAACGATTT CTGATAGCTT AACAGCAAAA GTTGAAGTTA 900 

CATTGCTTGA TGGATCAAAA GTGATTGTTA ATGTTCCTGT AAAAGTTGTA GAAAAAGAAT 960 

TGTCAGTAGT CAAACAACAG GCAATTGAaT CAATCGAAAA TGCGGCACAA CAAAAGATTA X020 

10 

ATGAAATCAA TAATAGTGTG ACATTAACAC TGGAACAAAA AGAAGCTGCA ATTGCGnAAG 1080 

TTAATAAGCT TAAACAACAA GCAATTGGAT CATGTTnAAC AATGGCACCT GGATGTTCCA 1140 

1S TTCAGTTGAA GGAAATTTCA ACAACAAGGA ACAAGCGCCn GATTGGAACA ATTTGA 1196 

(2) INFORMATION FOR SEQ ID NO: 72: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1519 base pairs 
20 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



• (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 72: 



40 



45 



CAATCGTTTC 


AACGCTATTA 


TCTTTAGACA 


ACAATTGTAA 


GCGTGTATGT 


GCAGTTTCTA 


60 


AACAGTCTAT 


AATTCGAGTT 


CTTAATT CAG 


CTGGATCATC 


TTTAAAAATA 


AAATCCATCG 


120 


CTGCAACTTT 


GTAGACAAAT 


GTTAAATAGG 


TAAGTTCACT 


GTGACTCGTA 


ACGAAAATAA 


180 


TGTTACCAAC 


TGGGTCATGC 


TTACGAATTT 


CACTGCCTAA 


TTTGATACCA 


TTAATATCAG 


240 


TTGAAAGTTG 


AATATCTAAA 


AAGTAACAGC 


CTATGTCATT 


CAT ATTTTTA 


GCTTGCTCAA 


300 


GCACCTCATA 


AGGATTATCA 


GTTGCGAGGG 


CAATTTCCAT 


AGGCTTTTCT 


TCTATCATTA 


360 


TATAATTTTT 


AATAATGGTA 


ACCATGTTTT 


CTCTTTGTTT 


TGGATCGTCT 


TCGCAAATGA 


420 


AAATTTTCAT 


ACATTCACAT 


CCTTATGGCT 


AGTTGTTAAT 


AATTTCAACT 


TTTTGAATAA 


480 


AGAAACCATT 


TTCGATAATT 


GTATCTAATA 


AGACATTGTC 


TGCATTATCA 


GCAATTTCTT 


540 


TTAAAGTTGA 


TAGACCTAAA 


CCACGACCTT 


CACCTTTAGT 


AGAAAAACTT 


TCTTGGAACA 


600 


ATTCATGAAT 


GCGTGGTATA 


TCATCAGCGC 


ATTTATTCAT 


AACAATAAAC 


GTTACTGAAT 


660 


TTTCACTTTC 


AATAAATGCA 


ACGCGAATGA 


TAGGGTCATC 


AATTTCAGTT 


GATGCCTCAA 


720 


TTGCATTATC 


AAGAATAATA 


CCAATACTGC 


GACTTAAATC 


GATCATATTC 


AAGTTAATGC 


780 


TACTTACTTC 


ATCGGGTATT 


TCGATACTAA 


TCGGAATATT 


CATTTCTTGT 


GCACGTAAAA 


840 


TTTTCGCAGT 


AATTAAGCCT 


TTAATTTCAC 


GTACTTTAAG 


ATTCTCGATA 


CCATTTAATT 


900 
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GTAGGCCAGG CATGTCATCT TCTCGAATGT ATTCTGAAAG TGTCGTTAAG ATATTGACAT 1020 

AATCATGACG GAACTTGCGC ATTTCGTTGT TGATAGCTTC AATCTTCAAT GTATATTCAT 1080 

AATAGGTTTC AATTTCTTCT TGATTACGTT TATATTTCAT CTCTTTAAGG AGAAATTGAG 1140 

AAATAACAAA TGTTAATATA CTTAAAAATA TAGTGATACC AATAAAAATA AAAGAATACT 1200 

GCCTTATTAC TTTAGCTTCA TCCGAGTTTA TTTGTGAATA AAAGAAAAAT AATGAAAAAG 1260 

TAAGCAGTAA GATAGTCGAA ATAACTATTA AAAATCCTTT GTTTAGTATT AGATATGGTG 1320 

TGCTAATTTT TTTGAGAACT CTATTTATTA TATATGAGAA TAGTATACTA ATAGTCACAT 1380 

AAACTACAAA AAAGCTAGGG AATATTACAA ATATACTATC AGAAATTTTG GTGGATATAT 1440 

GCATATATAA CTATATACCT GTAGTTAGCA CnGTnATAGG AATAATCnGG CGAGGTCCAT 1500 

AATCCACCAA AATAGAATA 1519 
(2) INFORMATION FOR SEQ ID NO: 73: 



(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 5445 base pairs 

(B) TYPE.- nucleic acid 

(C) STRANDEDNESS : double 
25 (D) TOPOIiOGY: linear 



,(xi) SEQUENCE DESCRIPTION; SEQ ID NO: 73: 

GTAGGAATCT CTTTGTCTTT TTGGGAGGAC ATTTAATATG AATGTATATT TAGCAGAATT 60 

CCTAGGAACT GCAATCTTAA TCCTTTTTGG TGGTGGCGTT TGTGCCAATG TCAATTTAAA 120 

GAGAAGTGCT GCGAATGGTG CTGATTGGAT TGTCATCACA GCTGGATGGG GATTAGCGGT 180 

TACAATGGGT GTGTTTGCTG TCGGTCAATT CTCAGGTGCA CATTTAAACC CAGCGGTGTC 240 

TTTAGCTCTT GCATTAGACG GAAGTTTTGA TTGGTCATTA GTTCCTGGTT ATATTGTTGC 300 

TCAAATGTTA GGTGCAATTG TCGGAGCAAC AATTGTATGG TTAATGTACT TGCCACATTG 360 

GAAAGCGACA GAAGAAGCTG GCGCGAAATT AGGTGTTTTC TCTACAGCAC CGGCTATTAA 420 

GAATTACTTT GCCAACTTTT TAAGTGAGAT TATCGGAACA ATGGCATTAA CTTTAGGTAT 4 80 

45 TTTATTTATC GGTGTAAACA AAATTGCCGA TGGTTTAAAT CCTTTAATTG TCGGAGCATT 540 

AATTGTTGCA ATCGGATTAA GTTTAGGCGG TGCTACTGGT TATGCAATCA ACCCAGCACG 600 

TGATTTAGGT CCGAGAATTG CACATGCGAT TTTACCAATA GCTGGTAAAG GTGGTTCAAA 660 

50 TTGGTCATAT GCAATCGTTC CTATCTTAGG ACCAATTGCC GGTGGTTTAT TAGGTGCAGT 720 

GGTATACGCT GTATTTTATA AACATACATT TAATATTGGT TGTGCAATTG CrATTGTTGT 780 
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CGAATCAATT 


TACTAAAATA 


AAAAGAAACG 


TAAATAGCAT 


AATTTAACAT 


GTTTGATTCA 


900 




TGGATTATGC 


TATTTTTTCG 


CCAAAATTTA 


ACAGATTTTG 


TACAATGGGT 


TAGCGATTAT 


960 


5 


TTTTTAATAA 


AGGAGATACT 


ACTAATGGAA 


AAATATATTT 


TATCTATAGA 


CCAAGGAACA 


1020 




ACAAGCTCAA 


GAGCGATTTT 


ATTCAATCAA 


AAAGGGGAAA 


TTGCAGGGGT 


AGCACAACGT 


1080 




GAGTTTAAGC 


AATATTTTCC 


ACAATCAGGT 


TGGGTTGAAC 


ATGATGCAAA 


TGAAATTTGG 


1140 


10 


ACATCTGTGT 


TAGCTGTAAT 


GACGGAAGTA 


ATTAATGAAA 


ATGATGTTAG 


AGCTGATCAA 


1200 




ATTGCAGGTA 


TCGGTATTAC 


AAACCAACGT 


GAAACAACGG 


TTGTTTGGGA 


CAAaCATACT 


1260 


15 


GGCCGCCCAA 


TTTATCACGC 


AATTGTTTGG 


CAATCACGTC 


AAACACAATC 


AATTTGTTCA 


1320 


GAATTAAAAC 


AACAAGGATA 


TGAACAAACA 


TTTAGAGATA 


AGACAGGATT 


ACTTTTAGAT 


1380 




CCGTATTTTG 


CAGGTACAAA 


AGTTAAATGG 


ATTCTAGACA 


ATGTTGAAGG 


TGCACGAGAA 


1440 


20 


AAAGCAGAAA 


ATGGCGATCT 


ATTATTTGGA 


ACGATTGATA 


CTTGGTTAGT 


ATGGAAATTA 


1500 




TCaGGaAAAg 


CtGCGCATAT 


TACTGATTAT 


TCaAATGCGA 


GTCGTACATT 


AATGTTTAAT 


1560 




ATCCATGATT 


TAGAATGGGA 


CGATGAGTTA 


TTAGAACTAt 


TACAGTACCT 


AAAAATATGT 


1620 


25 


TGCCAGAAGT 


TAAAGCTTCG 


AGTGAAGTAT 


ATGGTAAGAC 


AATTGATTAC 


CACTTCTATG 


1680 




GTCAAGAAGT 


ACCAATCGCT 


GGAGTAGCTG 


GTGATCAACA 


AGCAGCATTA 


TTTGGACAAG 


1740 




CTTGCTTCGA 


ACGTGGTGAC 


GTGAAAAAGA 


CATATGGAAC 


TGGTGGCTTC 


ATGTTAATGA 


1800 


30 


ATACAGGTGA 


CAAAGCGGTT 


AAATCTGAAA 


GTGGTTTATT 


AACAACAATT 


GCTTATGGTA 


1860 




TTGATGGAAA 


AGTAAATTAT 


GCGCTTGAAG 


GTTCCATCTT 


TGTTTCGGGT 


TCAGCAATCC 


1920 


35 


AATGGTTACG 


TGATGGATTA 


AGAATGATTA 


ATTCAGCACC 


ACAATCAGAA 


AGTTATGCGA 


' 1980 


CACGAGTTGA 


CTCTACTGAG 


GGTGTTTATG 


TTGTTCCAGC TTTTGTAGGT 


TTAGGAACAC 


2040 




CATATTGGGA 


TTCTGAAGCA 


CGTGGTGCGA 


TTTTCGGTTT 


AACACGTGGA 


ACTGAAAAAG 


2100 


40 


AGCACTTTAT 


CCGTGCAACT 


TTAGAATCAC 


TATGTTACCA 


AACT CGTGAC 


GTTATGGAAG 


2160 




CAATGTCAAA 


AGACTCTGGT 


ATTGATGTCC 


AAAGTTTACG 


TGTCGATGGT 


GGTGCAGTTA 


2220 




AAAATAACTT 


TATTATGCAG 


TTCCAAGCAG 


ACATTGTTAA 


TACTTCTGTT 


GAAAGACCTG 


. 2280 


45 


nr%*\± lUviun 




TTAGGTGCTG 


CATTTTTGGC 


AGGTTTAGCA 


GTTGGATTCT 


2340 




GGGAGAGTAA 


AGATGATATC 


GCTAAAAACT 


GGAAATTAGA 


AGAAAAATTC 


GATCCGAAAA 


2400 




TGGATGAAGG 


CGAAAGAGAA 


AAATTATATA 


GAGGTTGGAA 


AAAAG CTGTT 


GAAGCAACAC 


2460 


50 


AAGTTTTTAA 


AACAGAATAA 


ACTTGTAGAT 


TAGACTTTTG 


TATAAACATT 


GTGATACAAT 


2520 




CAATTTAAGT 


TAATATTTGA 


ATCGAGAAGC 


GAGAGATTTG 


TTCGAACATG 


TACAATTGAA 


2580 



55 



517 



EP0 786 519 A2 





GCATTGTCTA 


. CTTTTAAGAG 


AGAACATATT 


AAAAAGAATT 


TAAGAAATGA 


TGAATATGAT 


2700 




TTAGTAATTA 


, TTGGTGGCGG 


TATTACAGGT 


GCAGGTATTG 


CACTAGACGC 


GAGTGAAAGA 


2760 


5 


GGAATGAAAG 


TTGCATTAGT 


TGAAATGCAA 


GACTTTGCAC 


AAGGAACAAG 


CTCAAGATCT 


2820 




ACAAAATTAG 


TCCATGGTGG 


TTTGCGTTAC 


TTAAAACAAT 


TCCAAATTGG 


AGTAGTTGCC 


2880 


10 


GAAACTGGTA 


AAGAACGTGC 


GATTGTTTAT 


GAAAATGGGC 


CTCATGTTAC 


GACTCCAGAG 


2940 


TGGATGCTTT 


TACCAATGCA 


TAAAGGTGGA 


ACATTTGGTA 


AATTCTCAAC 


ATCAATTGGT 


3000 




TTAGGAATGT 


ATGATCGTTT 


AGCAGGTGTT 


AAGAAGTCTG 


AACGTAAAAA 


AATGTTATCT 


3060 


15 


AAAAAAGAAA 


CTTTAGCTAA 


AGAACCATTA 


GTTAAAAAAG 


AAGGTCTAAA 


AGGCGGCGGT 


3120 




TACTATGTTG 


AATATCGTAC 


TGACGATGCG 


CGTTTAACTA 


TTGAAGTTAT 


GAAGCGTGCT 


3180 




GCTGAAAAAG 


GCGCAGAAAT 


TATCAACTAT 


ACTAAATCTG 


AACACTTCAC 


TTATGATAAA 


3240 


20 


AATCAACAAG 


TAAATGGTGT 


TAAAGTTATA 


GATAAATTAA 


CTAATGAAAA 


TTATACAATT 


3300 




AAGGCTAAAA 


AAGTGGTTAA 


TGCAGCAGGT 


CCATGGGTTG 


ATGATGTTAG 


AAGTGGTGAT 


3360 




TATGCACGCA 


ATAATAAAAA 


ATTACGTTTA 


ACTAAAGG TG 


TACATGtTGT 


TATTGATCAA 


3420 


25 


TGAAAATTCC 


CATTAGGTCA 


AGCAGTATAC 


TTTGATACTG 


AAAAAGATGG 


AAGAATGATT . 


3480 




TTTGCAATTC 


CACGTGAAGG 


AAAAGCGTAT 


GTAGGTACTA 


CAGATACATT 


CTATGACAAT 


3540 


30 


ATCAAATCTT 


CACCATTAAC 


TACACAAGAA 


GACAGAGACT 


ATTTAATCGA 


TGCGATTAAT 


3600 


TACATGTTCC 


CTAGTGTTAA 


TGTTACAGAT 


GAAGATATTG 


AATCAACATG 


GGCAGGAATT 


3660 




AGACCATTAA 


TTTA CGAAGA 


AGGCAAAGAC 


CCTTCTGAAA 


TCTCTCGTAA 


GGATGAAATT 


3720 


35 


TGGGAAGGTA 


AATCAGGTTT 


ATTAACTATT 


GCAGGTGGTA 


AATTAACAGG 


CTATCGTCAC 


3780 




ATGGCTCAAG ACATTGTTGA 


TTTAGTATCT 


AAACGCTTGA 


AAAAAGACTA 


CGGTTTAACA 


3840 




TTTASTCCAT 


GTAATACAAA 


AGGTCTGGCA 


ATTTCAGGTG 


GCGATGTAGG 


TGGTAGCAAG 


3900 


40 


AACTTTGATG 


CGTTTGTAGA 


GCAAAAAGTA 


GATGTAGCTA 


AAGGATTCGG 


CATTGATGAA 


3960 




GATGTTGCAA 


GACGTTTAGC 


ATCTAAATAT 


GGTTCAAATG 


TTGATGAATT 


GTTCAACATT 


4020 




GCGCAAACAT 


CTCAATACCA 


TGATAGCAAG 


TTACCATTAG 


AAATTTATGT 


AGAACTTGTT 


4080 


45 


TATAGTATTC 


AACAAGAAAT 


GGTATACAAA 


CCTAACGATT 


TCTTAGTTCG 


TCGTTCTGGT 


414 0 




AAAATGTATT 


TCAATATTAA 


AGATGTATTA 


GATTATAAAG 


ATGCTGTCAT 


CGATATTATG 


4200 


SO 


GCAGATATGC 


TTGATTACTC 


TCCAGCTCAA ATTGAAGCAT 


ATACTGAAGA 


AGTTGAGCAA 


4260 


GCAATTAAAG 


AAGCGCAACA 


TGGaAATAAT 


CAACCAGCAG 


TTAAAGAATA 


AtTAATTTGT 


4320 




ACAATCATAA 


ACTGGTGTCC 


TGTTTTAAGG 


GCATCAGTTT 


TTTTATAGGA 


GATACATTAG 


4380 
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GTTATTAAAG 


GTGTGAGATG 


ATGACTGAAA 


AACAATTTAA 


ATTAACTGTA 


CAAGATAATA 


4500 




, CGAATATTGA 


AGTTAAAGTG 


AATTTTACAG 


ATGTAGATTC 


AAAAGGAATT 


ATT CAT ATAT 


4560 


5 


TTCATGGTAT 


GGCTGAACAT 


ATGGAACGTT 


ACGATAAATT 


AGCACATGCA 


CTTTCAAAGC 


4620 




ATGGCTTCGA 


TGTGATACGT 


CATAATCATC 


GAGGACATGG 


TATTAATATT 


GATGAATCAA 


4680 




CAAGAGGGCA 


TTACGATG AT 


ATGAAACGAG 


TTATCGGTGA 


TGCCTTTGAA 


GTAGCGCAAA 


4740 


10 


CAGTGAGAGG 


CAATGTTGAT 


AAACCATACA 


TTATAATCGG 


ACATTCAATG 


GGATCCGTTA 


4800 




TAGCTAGATT 


GTTTGTAGAA 


ACATATCCGC 


AATATGTTGA 


TGGTCTAATT 


TTAAGTGGTA 


4860 


15 


CTGGTATGTA 


TTCATTATGG 


AAAGGTTTAC 


CAACCGTTAA 


AGTGTTACAA 


CTGATTACAA 


4920 


AAATTTATGG 


TGCTGAGAAA 


CGAGTTGAAT 


GGGTTAACCA 


GTTAGTATCA 


AATAGTTTTA 


4980 




ATAAAAnnAT 


ACGTCCATTA 


CGTACACAAA 


GTGATTGGAT 


TTCTAGTAAT 


CCAATTGAAG 


5040 


20 


TAGATAaCTT 


TATTAAAGAT 


CCATATAGTG 


GaTTTAATGT 


GTCAAATCAA 


TTATTATATC 


5100 




AAACAGCCTA 


TTATATGCTA 


CATACATCAC 


AATTAAAAAA 


TATGAAAATG 


TTAAaTCATG 


5160 




CCATGCCTAT 


ATTATTAGTT 


TCAGGATATG 


ACGATCCTTT 


AGGTGATTAT 


GGTAAAGGGA 


5220 


25 


TTTTAAAATT 


GGCGAATATA 


TATAGAAACG 


CTGGCATnAA 


AAATGTTAAA 


GTGAATCTTT 


5280 




ATCATCATAA 


ACGTCATGAA 


GTGTTATTTG 


AAAAnGATCA 


TGACnAAATT 


TGGGAAGACT 


5340 




TGTTTAAATG 


GTTGAATCAA 


TTTTATAAAA 


AATAAAGAAA 


GTGGAATTAA 


ATATGAATAA 


5400 


30 


AAATAAGCCT 


TTTATTGTAG 


TAATTGTGGG 


GCCAACTGCT 


TGCAG 




5445 



(2) INFORMATION FOR SEQ ID NO: 74: 

(i) SEQUENCE CHARACTERISTICS: 
35 (A) LENGTH: 2569 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

r (D) TOPOLOGY: linear 



40 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 74: 



TGGCTTGAAC TACGCCAATA AGTCCCCCTA GTACAAGAAT GAATACCATG ATATCGACCG 60 

45 CTTCTATCGT ACCTTCAACC ATGCTACTTG TTATTTGTTC TGGTCCAGCT GGATGTTGCT 120 

TTAATCTTTC ATAAGTATTC GGAATTGATA CCGGCTTATT AATTGCACCT GATTTAAATT 180 

GTTCAATCTT AATTTTAACC CCCATTTTGT CTAGTTCCTG TTGCGTACCC GGAACCTTTT 240, 

50 TCACTTGGTT ATGAGGGTTA ACTATCTTTA GTTCTTGGGA TGAAGGTTCG TAAGAAAGTT 300 

TAGAATATGC ACCAGCAGGA ATAACCCATG TTGCTATAAC TGCAACAACC GTTAAAATGA 3 60 
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10 



15 



20 



45 



TAATTGTATT TTCCACGGTT TCATCTCCTT CGACATTTAA CCTAGCATTT CTACCTTAAA 480 

GATTTTATAA ATATAAATTA AGAAAGTGCA CCCCGCATCA AAATAGAGGC ATTATTTTCA 540 

GGGGGTGCAC ATAAATAATA AAAATCATGC ATTTGACATA TAGTAATTGA AAAGCGTTTC 600 

AATT CAATTA CTTTTTAATC ACAGTACCTA CTTTACCCTC TAAGGCAGCA TCTAATTCAT 660 

TTAATGATGT TATAAGCACA CTTCCTTTTG GATTGTTTTC AATAAATGAT ATGGCTGCTT 720 

CAATTTTTGG TAACATACTT CCTTTTGCAA ATTGATTTTC GTCTATATAT CGTTTTAATT 780 

CATCAACATT TGTTGTTTTC AAAGGCTGTT GGTTTTCAGT GTTAAAATTA ATATATACAT 840 

AATCAATTGC TGTTAAAATA ATCAATTGAT CGCATTGAAT ATTAGCACCC AACAACGCAC 900 

TTGTTTTATC TTTGTCTATA ACTGCATCAA TACCTTTAAA ACCATCATGT TGCTCTCTAA 960 

TTACTGGTAT ACCTCCACCA CCAGCAGCAA TAACGAGTGT ATCATTTTTA ATAAGTGTTT 1020 

TAATACTCTC TAATTCAATA ATAGAGATGG GTTGTGGTGA AGGAACAACG CGTCTATATC 1080 

CTCTTCCAGC ATCTTCAACA AATATAAATC CTTTTTCTTT TTGAATTTGT TCAGCTTCTT 1140 

CTTTGTTGTA AAATAACCCA ATTGGTTTTG AAGGATTGTT AAATGCCGGA TCATTTTCAT 1200 

CAACTTCAAC TTGTGTCACT AGTGTTACCA CTTGTTTATC CATTCCAATA GAATGCAATT 1260 

CATTTTGTAA GCTTTCTTGT AATTGATAGC CGATGTAAGC TTGACTCATT GCGCCACATT 1320 

CAGCAAATGG AAATGCCGGA CCTTGGTTAT GTTCTGCAGC ATAGTTAAGT CCCAAATTAA 1380 

TGCTTCCAAC CTGTGGTCCA TTACCATGAC TAATAACAAT CTCATGTCCT TTTGTnATTA 1440 

AyC CT ACT AA TG ATT t CG CA GTATTTTTAA CAAGCTCGAG TtGgTyCTTG aGGTGATTTn 1500 

CCTAAAGCAT TACCACCTAA TGCTACTACT ATTTTCGCCA TCATATTCAC TTCCTTATAT 1560 

CATTTAAAAT TCACCCAATG TAG CAACCAT GaCTGCTTTG ATTGTATG CA TTCTGTTCTC 1620 

AGCTTCTTGG AATACAACTG AAGCTTTACT TTCGAATACT TCATCTGTAA CTTCCATTTC 1680 

TCGAATACCA TATTTTTCAA AAATTTGTTG ACCTATTTTC GTATCAG CAT TATGGAAAGA 1740 

TGGTAAGCAA TGCTCAAAAA TAACATTTGG ATTACCAGTT TTATCCATTA TTTCTTTATT 1800 

TACTTGATAT GGTTTCAATA ATTCAAGTCG TTCTTTCCAT ACTTCATCAG GTTCACCCAT I860 

TGATACCCAA ACATCAGTGT AAATTACATC CGAACCTTTT ACaCCTTGGT CaATATCATC 1920 

TGTGATTAAT ATGTTGCCaC CATTTTCaGC GGCAATATTT TTACAGCGAT TTAATAATTC 1980 

ATCTGTTGG A TTTAATTCTT TTGGACAAAC TAAATGGAAG TTCATACCCA TAATGGCAGC 204 0 

ACCTTGCATT AATGCATTTG CAACGTTATT ACGACCATCT CCAACATATG TAAAGTTAAT 2100 

ATCTGCATAA TCTTTTTTTA AGACTTCTTT TGCTGTTAAG AAATCAGCAA GAACTTGAGT 2160 
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TTCTACTGTT CTTTGTGAAA AACCACGGTA TTCAATGCCA TCATACATTC CACCAAGCAC 2280 

ACGTGCAGTA TCTTTAGTTG TTTCTTTTTT ACCCATTTGT GATCCAGTTG GGCCTAAATA 234 0 

AGTTACATTT GCACCTTGAT CATGCGCTGC AACTTCAAAT GCACATCGCG TTLTTGTAGA 2400 

ATCTTTTTCA AATAACAGTG CAATATTTTT ATTTTTTAAC ATAGGCTTTT CAGTGCCAAT 2460 

ATATTTAGCA CGTTTTAAAT CCTCGGAGAG TGTTAATAAG GTTCTACCTC TTGTCGTGAA 252 0 

AAGTCTAATA AAGTTAAAAA ACTTCTGTTT CGTAnATTTT TCATTAAnA 2569. 

(2) INFORMATION FOR SEQ ID NO: 75: 

(i) SEQUENCE CHARACTERISTICS: 
*5 (A) LENGTH: 1273 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 • 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 75: 

CCTGGAACCA TCCaATCG t G CaAATCtTGa AAGaGAATAC GCAACAACAA TTAAATGTAT 60 

25 TGGAACACTA. TATTCCAAAT GACCATCCAG CACTCGTTGA ATTAAAAATA TGGGAACGTT 120 

GGTTACATAA ACAAGGTTAC AAAGACATCC ATTTAGATAT TACTGCGCAC CACCTAGATC 180 

CTATTACACA GGTTTATTTA TTCAATGTCA TTTTGCTGAA AATGAATCTC GAGTTTTAAC . 240 

AGGTGGTTAT TACAAAGGAA GCATCGAAGG GTTTGGATTA GGATTAACAC - TTTAAGTAAG 300 

GGAGTATGCA CAATGTTAAG AATCGCCATA GCCAAAGGAC GTCTAATGGA TAGTTTAATT 360 

AACTATTTAG ATGTAATTGA ATATACGACA TTATCAGAAA , GATTAAAAAA TAGAGAACGC 420 

CAATTATTAT TAAGTGTAGA TAATATTGAA TGCATTTTAG . TAAAAGGAAG: TGACGTGCCA ^80 

ATCTATGTGG AACAAGGAAT GGCAGACATA GGCATTGTTG GTAGCGACAT ATTAGATGAG 540 

CGCCAATATA ATGTTAATAA TTTGTTGAAT ATGCCTTTTG GAGCATGTCA TTTTGCGGTT 600 

GCAGCGAAAC CTGAAACGAC CAATTATCGT AAAATCGCAA CGAGTTATGT TCATACTGCT 660 

GAAACATATT TTAAATCAAA AGGTATTGAT GTCGAATTGA TTAAATTGAA TGGCTCTGTT 720 

45 GAATTGGCCT GTGTTGTAGA TATGGTAGAC GGAATTGTCG ACAT CGTTCA AACAGGTACT 780 

ACGCTAAAAG CGAACGGACT GGTTGAAAAG CAACATATTA GTGATATCAA TGCAAGATTA 840 

. ATAACTAATA AAGCAGCTTA TTTTAAAAAA TCACAATTAA TAGAGCAATT TATTCG CTCT 900 

50 TTGGAGGTGT CTATTGCCAA TGCTTAATGC ACAACAATTT TTAAAT CAAT TTTCATTAGA 960 

AGCACCATTA GATGAGTCAT TGTATCCaAT TATTCGCGAT ATTTGTCAGG AAGTTAAAGT 1020 
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TTTAGaAATT AGTCATGAmC AAATTAAAGC AGCATTTGAC ACATTAGATG AAAAAACAAA 1140 

ACAAGCATTA CAACAAAGTT ATGAAAGAAT TAnAGCATAT CAaGAAaGTA TtaAACAGaC 1200 

GaATCAACAG TTAGAAGaAT CAGTGGaGTG tTrTGaAATA TACCATCCmC taGaAAGTGT 1260 

CGGTATTTAT GTG 1273 



(2) INFORMATION FOR SEQ ID NO : 76 : 

10 

(l) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13 08 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY : linear 

15 

(xi> SEQUENCE DESCRIPTION: SEQ ID NO: 76: 

20 GTTGATAAAT TAAAAATGTT TTTATCAGAT ATTCAAAGTT ACCAACAATA TAGTAAAGAT 60 

CATCCGGTGT ATCAGTTAAT TGATAAATTT TATAATGATC ATTATGTTAT TCAATACTTT 120 
AGTGGACTTA TTGGTGGACG TGGACGACGT GCAAATCTTT ATGGTTTATT TAATAAAGCT 180 

25 ATCGAGTTTG AGAATTCAAG TTTTAGAGGT TTATATCAAT TTATTCGTTT TATCGATGAA 24 0 

TTGATTGAAA GAGGCAAAGA TTTTGGTGAG GAAAATGTAG TTGGTCCAAA CGATAATGTC 300 

GTTAGAATGA TGACAATTCA TAGTAGTAAA GGTCTAGAGT TTCCATTTGT CATTTATTCT 360 

30 

GGATTGTCAA AAGATTTTAA TAAACGTGAT TTGAAACAAC CAGTTATTTT AAATCAGCAA 420 

TTTGGTCTCG GAATGGATTA TTTTGATGTG GATAAAGAAA TGGCATTTCC ATCTTTAGCT 480 

TCGGTTGCAT ATAGAG CTGT TGCCGArAAA GAACTTGTGT CAGAAGAAAT GCGATTAGTC 54 0 

35 

TATGTAGCAT TAACAAGAGC GAAAGAACAA CTTTATTTAA TTGGTAGAGT GAAAAATGAT 600 

AAATCATTAC TAGAACTAGA GCAATTGTCT ATTTCTGGTG AGCACATTGC TGTCAATGAA 660 

4Q CGATTAACTT CACCAAATCC GTTCCATCTT ATTTATAGTA TTTTATCTAA ACATCAATCT 720 

GCGTCAATTC CAGATGATTT AAAATTTGAA AAAGATATAG CACAAATTGA AGATAGTAGT 780 

CGTCCGAATG TAAATATTTC AATTGTGTAC TTTGAAGATG TGTCTACAGA AACCATTTTA 840 

45 GATAATGATG AATATCGTTC GGTTAATCAA TTAGAAACTA TGCAAAATGG TAATGAAGAT 900 

GTTAAAG CAC AAATTAAACA CCAACTTGAT TATCGATATC CATATGTAAA TGATACTAAA 960 

AAGCCCTCAA AACAATCTGT TTCTGAATTG AAAAGACAAT ATGAAACAGA AGAAAGTGGC 1020 

50 

ACAAGTTACG AACGAGTAAG GCAATATCGT ATCGGTTTTT CAACGTATGA ACGACCTAAA 1080 

TTTCTAAGTG AACAAGGTAA ACGAAAAGCG AATGAAATTG GTACGTTAAT GCATACAGTG 1140 
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GATGGATTAA TCGATAAACA TATTATCGAA GCAGATGCGA AAAAAGATAT CCGTATGGAT 1260 

GAAATAATGA CATTTATCAA TAGTGATTAT ATTCGATATT GCTGAAGC 13 08 

5 (2) INFORMATION FOR SEQ ID NO: 77: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 1431 base pairs 
<B) TYPE: nucleic acid 
10 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



15 



25 



30 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 77: 

GATGCCATTn ATnnGTATGC AAGAAGTTGT TCCGGGTTCA GGTGGATTaC CAGTTGGTAC 60 

TGGTGGTAAG ACGTTACTAA TGCTTTCAGG CGGTATAGAC TCACCAGTTG CTGGGATGGA 120 

20 AGTGATGAGA CGTGGCGTAA CAATTGAAGC GATTCATTTC CATAGTC CAC CATTTACAAG 180 

TGATCAAGCA AAAGAAAAAG TTATTGAATT GACACGTATT TTAGCTGAAC GTGTTGGACC 240 

AATTAAATTG CATATTGTAC CATTTACAGA ATTGCAAAAA CAGGTAAATA AAGTTGTACA 300 

TCCAAGATAT ACAATGACTT CAACGAGACG TATGATGATG CGTGTTGCTG ATAAATTAGT 360 

r 

ACATCAAATA GGGGCTTTAG CTATTGTAAA TGGTGAAAAC CTAGGGCAGG TAGCCAGTCA 420 

AACACTTCAT AGCATGTATG CAATTAATAA TGTAACTTCT ACTCCTGTAT TACGTCCTTT 4 80 

ATTAACTTAC GATAAAGAAG AAATTATTAT TAAATCGAAA GAAATTGGTA CATTTGAAAC 540 

ATCTATTCAA CCATTTGAAG ATTGTTGTAC A AT T TT CACC CCTAAAAATC CAGTAACCGA 600 

ACCAAACTTT GATAAGGTAG TCCAATATGA AAGTGTCTTT GATTTTGAAG AGATGATTAA 660 

35 

TCGTGCTGTT GAAAATATTG AAACACTTGA AATAACTAGT GATTAT AAAA CTATTAAAGA 720 

ACAGCAAACA AACCAATTAA TAAACGACTT TTTATAAATA AAATCCTAGA GTAAATTTAA 780 

40 ACATAAGGGG ATGTTAAACT ATGGATTTGA ACTTAACGAT GATTATAATC ATAATTTTAT 840 

TTGGTTTTAT CGCGGCGTTT ATAGATTCGG TTGTAGGGGG TGGCGGTTTA ATTTCTACGC 900 

CAGCATTATT AGCAATCGGT CTACCACCAT CTGTGGCTTT AGGTACAAAT AAATTGGCAA 960 

45 GTTCGTTTGG TTCTTTAACT AGTACGATAA AGTTTATAAG GTCCGGTAAA GTGGACTTAT 1020 

ATGTTGTTGC CAAATTATTT GGTTTTGTAT TTTTGGCATC TGCATGTGGC GCATATATTG 1080 

CAACGATGGT TCCGTCACAA ATATTGAAAC CTTTAATCAT CATTGCACTT TCGTCGGTGT 1140 

50 

TTATATTCAC ATTACTTAAA AAAGATTGGG GCAATACACG CACGTTTACT CAATTTACAT 1200 

TTAAGAAAGC CATAATATTT GCAGCACTTT TTATATTAAT CGGCTTTTAT GATGGATTTG 1260 
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TAAGTGCAGC AGGAAATGCT AAAGTTTTGA ACTTTGCTTC TAATATAGGT GCGCtTGTAT 1380 
TATTTATGGT ATTAGGACAA GTAGATTATG TAATAGGTTT AATTATGGCT A 1431 

5 

(2) INFORMATION FOR SEQ ID NO: 78: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4403 base pairs 
<B) TYPE: nucleic acid 
10 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

IS (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 78: 
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AATATTATTT 


TAAATTCAAT 


4\ X X X J\ X X urv> X 


Vj\»nl X Inl X X 




ATTCGCCTTT 


oU 


ACCATTATTT 


TCATGGAAAG 




A fiTT^TiT^T 
/vi X Ivlnl^l 


X X vj^j 1 X 


AL. lAu XLX 1A 




GTTTTCTTGC 


CTTTATTCGG 


f^VTr* A T w T v l* r T' Tl 
N» X Iwtl X X Xn 


f T*R r — i — i-T\ r »■ i* A ^ 


TzinnamzifEv 

X nVJ\xnL»unv.A 


AA1 IWUitJVjl 




GACCAAATTT 


TCAAAATTGA 


T A Ann A Afl AT 


A AAA A Ann AT 


T Af! AflTTA AT 
InVjnVjl XnnX 




o a n 


CAATTAGCTG 


CTTTAAAAAA 


1Y3AAAA m*r 


TPAAATTPPA 


ATTATPAAAT 


TYJ'I'A A A &TTT 


JUU 


AAAGAAATGA 


TTCAAATGTT 


GTTATATAAT 


AACGCAG CAT 


TTTTAAf"!AAP 


AGACAACC3AT 


3 60 


TTArrrrtAT 


ACACAGACGG 


CCAAGAAAAA 


TTTGATGACC 


TAATACAAGA 


CATCCGTAAT 


420 


GCTACTGATT 


ATATTCATTT 


TCAGTACTAT 


ATTATTCAAA 


ATGATGAATT 


AGGTCGTACC 


480 


ATTTTAAATG 


AACTTGGTAA 


AAAAGCGGAA 


CAAGGTGTAG 


AAGTTAAAAT 


TCTTTATGAT 


540 


GACATGGGTT 


CTCGTGGACT 


GCGTAAAAAA 


GGCTTACGCC 


CGTTTCGCAA 


TAAAGGTGGA 


600 


CATGCTGAAG 


CATTTTTCCC 


ATCAAAATTA 


CCTTTAATTA 


ACTTGCGTAT 


GAACAATCGA 


660 


AACCATCGAA 


AAATTGTTGT 


AATAGATGGG 


CAAATTGGAT 


ATGTTGGTGG 


TTTTAATGTT 


720 


GGTGATGAGT ACTTAGGTAA 


ATCAAAAAAA 


TTCGGCTATT 


GGCGAGATAC 


GCATTTACGA 


780 


ATTGTCGGGG 


ATGCAGTGAA 


TGCATTGCAA 


TTACGATTTA 


TTCTAGATTG 


GAATTCACAA 


840 


GCCACACGTG 


ACCAGATCTC 


CTATGATGAT 


CGTTATTTCC 


CAGATGTAAA 


TTCTGGTGGA 


900 


ACAATTGGCG 


TTCAAATAGC 


TTCTAGTGGT 


CCTGACGAAG 


AATGGGAACA 


GATTAAATAC 


960 


GG CTATTTGA 


AAATGATTTC 


ATCTGCTAAA 


AAATCGATTT 


ATATTCAATC 


TCCCTATTTC 


1020 


ATACCTGATC 


AAGCCTTTTT 


AGATTCTATT 


AAAATTGCGG 


CATTAGGTGG 


TGTTGATGTC 


1080 


AATATCATGA 


TTC CTAATAA 


ACCTGACCAT 


CCX5TTTGTTT 


TTTGGGCTAC 


TTTAAAAAAT 


1140 


GCAGCATCCT 


TATTAGATGC 


CGGTGTTAAA 


GTATTTCACT 


ACGACAATGG 


CTTTTTACAC 


1200 


TCAAAAACAC 


TTGTTATAGA 


TGATGAAATT 


GCAAGTGTGG 


GAACAGCTAA 


TATGGACCAT 


1260 
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AAATTAAAAC AAGCTTTTAT . AGATGATTTA 
. TATGCTAAGC GAAGTCTTTG GATTAAATTT 
5 ATCTTATAAA ATAGAAATAT GAGGAGTGTA 

GCTGCCAAAA AATATATGGA ATCTATTCAT 
CATGTATATC GTGTCACTGC TTTAGCTAAA 

10 

ACTTTAGTCA TTGAACTCGC ATGTTTGCTT 
GCTAACAAAC AATATGTTGA ATTGAAGTCA 

1S GATCAAGAGG ACATTTTATT TATTATTAAT 

CATGTCACTT TATCTTTAGA AGGTCAAATT 
GGCGCTATAG GTGTTGCACG AACATTTCAA 

20 ACAGAACATA TGTCACTAGA TAAGATTAAT 

GCAATTAAAC ATTTCTTTGA AAAATTACTT 
GCGAAGATGA TTGCTAAAGA ACGTCACGAC 

25 ACGGAATGGA ATTGTCACGA CTAGACATTG 

CGTGTTGTTG TGGAAGCTTG GTGTCATGCC 
TGGTGACATG TCATGCTACT TTGATGTGCT 

30 

TGATGTGGCA TTGCGGTGTT ATGGTGTTAT 
TTGATGTGCT GGTACCACGA TGCGACTTGA 
ATGGTGTTAT AG AC CGGTTT GATGTTGATG 

35 

TGCGACTTGA TGTAGTGCTA TGATGTGGCG 

GGTGJTGATG TCATGCCGTT ACGATTCTAT 
40 TATGCCGTTG TGACGTTATT ATTTCACACT 

. TTTGCGACAT ATACTGCTAC ACTGATGAAT 

ATGACAACTC TGTTATTAAC CACTTTTTAC 
45 . TAAAAACAGC AGTAGGATGA CTTTCACATT 

CACATATTGT ATAATGTGAC ACTAAGTTTC 

ATAAAGTTAA AATTATCTTC AACTTTTAGG 

SO 

TTCTTTTTCT TTTTAGACAC AACTTGTGTG 

TGCTCTCTTT CATACGCTTC AATGAAAGGT 

55 



GCAGTATCTT CTGAATTAAC AAAAGCACGT ,13 80 

AAAGAAGGTA TTTCACAATT ATTGTCACCT 1440 

aCTTTAATGC AACAATCAGA CGTCATTAGT 1500 

CAAAATGATT ATACAGGCCA TGATATTGCG 1560 

TCAATCGCTG AAAATGAAGG TGTTAATGAT 1620 

CATGATACCG TTGACGAAAA AGTTGTAGAT 1680 

TTTTTATCTT CTTTATCACT ATCAACCGAA ' 1740 

AATATGAGCT ATCGCAATGG CAAAAATGAT 1800 

GTCAGGGATG CAGATCGTCT TGATGCTATA 1860 

TTTGCAGGAC ACTTTGGTGA ACCTATGTGG 1920 

GATGATTTAG TTGAACAGTT GCCACCATCT 1980 

AAGTTAGAAT CTTTAATGCA TACAGATACG 2040 

TTTATGATGA TGTACTTGAA ACAGTTTTTT 2100 

AAGTTGTAGT ATGATGATGC GATGTAATGG 2160 

ATGTTACTTT GATGTGTTGT TGTGGGAGCT . 2220 

GGTACCACGA TGCGTCTTGA TGTAGTGCTA 2280 

AGACAGGTTT GGCGTTGATG CCATGTTACT 2340 

TGTAGTGCTA TGATGTGGCA TTGCGGTGTT 24 00 

CCATGTTACT TTGATGTGCT GGTGCTACGA .2460 

TTGCGCTGTT ATGGTGTTAT AGCCAGGTTT 2520 

GATATGTTGT TGGGACGTTG CAATGTGTAT 2580 

GTTACATGTA TAAGTGAATT GCTGTGGAAA . 2640 

CATTGTGTCA AGATGACATT GCGATGAAGA 2700 

ATACTGAAAA CTCGTTAATA TTATTTCAAA 2760 

TGAAATCATC TTACTGCTGT TTCTATTTAT 2 820 

GCTATTGAAG CGAAAAATAA TGTGCGCCCT 2880 

GTGCACATTA TTTGGACTTG CTAAGGTTAT 2 940 

TTTTTGCCTT TTTTATTGCt GCCGCCGTTG 3 000 

TGTACTTCTT TTTTAGCGAC TTTTTCATAA 3 060 



525 



EP0 786 519 A2 



10 



is 



CCAAGTGCTG ATGCTGAGCT TAATGAAATC CAGATAATCA TAATTGGTGA AATGACCATC 3180 

ATCATGTAAC CCATTTGACG TTGTTCGTCT GGCATCGTTT TACTTGATAC ATATGCTTGG 324 0 

ATAAAGTATA AAACACCGGC AATAATTGTA ATCCAAATAT CAGGACGTCC TAAATCGAAC 3300 

CATAAGAAGT GTGGATATTT AAACAAACCA TCTACAAGTT GGTCTTTAAG TACAAAGTAT 336 0 

AATCCCATGA TGATTGGTAA TTGGATTAGC ATTGGTAAAC AACCCAACAT ACTCTTAATC 3420 

GGGTTCATGT CATACTTTTT ATATACTTGC ATTAATTCTT GGTTTGCAGC CATTTTTTCT 34 80 

TCTTGTGTAC GCGnCaCGTT CACTTTTTCT TGAATTTTTT CAACTTCTGG CTTTGCAACT 3540 

TTCATTTTTT GACGCATCAT ATGACTATTT TTATAGTTTG ACAACATGAA TGGTAATAAA 3 600 

ATAATACGAA TTACCAATAC AAGGATAATA ATAGCTAAAC CATAATTGTC GTTTAATAAG 3660 

TTATTTCCCA ACCAATCCAA TACATTTTTC ATTGGATCTA CGAATGTATT GTAGAAAAAy 3720 

SO cwCtACGTTT TTCAGGTTTA GAATAGTCAC AACGAGCGAA AAAGACCATA ATACCTAAAA 3780 

ATAATGGTAG TAACGCTTTT TTCTTCATTT TTCCACCTCT AT CATTATAT TCACATAGGA 3 84 0 

TTTATTCTAT CACATTAATG AGTACGTATG AAACAATAAG TGGAAAAATT TAACTAATTA - 3 900 

TTAAAAAAAT CTTTGAATCG ATTAACAGTC TTTTCAATAT TTTCACTTTT AGAAATGGCT 3 960 

GAAATGACTG AAATTCCATT GGCACCTGCT TCTACAATCG GCGCCACATT ATTAGTATTG 4020 

ATACGGCCAA TAGCTACAAT CGGTAGTTGC GGATTCATTT CTTTAAACGT TGCAATCATT 4080 

TCTGGACCTA CTGGTATATG CGCGTCATGC TTCGACGGCG TAGGATAGAT TGGTCCAACA 414 0 

CCTATATAAT CmACATGAGT TAAATCAGAT TTTGCATACT CATCTAAATC ACTAATACTA 4200 

AGTCCAATAA TTTTATCAGT GAAATATTGT GCTATCTCTT TGACTTTCGC ATCATCTTGA 42S0 

CCGACATGTA TACCATCCGC GTTAATTTCT TTTGCCAAGG ATACATCATC ATTAACGATA 4320 

AAAGGCACAT CATATTGATG ACAGAGATGC TGTAATTCTT TAGCTAATAC AAGTTTATCG 43 80 

40 TTTCCTTTTA AAGCTGATTC ACC 44 03* 

(2) INFORMATION FOR SEQ ID NO: 79: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1808 base pairs 
45 <B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D) TOPOLOGY: linear 

so 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 79: 

TGGAnCCAAT ATTAGAAATG ATTAAAACAT TAACAGGTAT TAATAGTCCT TCAGGAGnCA 60 

SS 
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TAACAAATAA AGGTGCGTTA TTAATAACAG TGCCAGGCAA AAATGATGAA GTACAACGCT 180 

GTATTACTGC TCATGTTGAT ACTTTAGGTG CaATGGTTAA AGAAATTAAA GAAGATGGTC 240 

GCTTaGCAAT AGAATTAATT GGAGGATTCA CGTATAACGC GATTGAGGGT GAATATTGCC 300 

AAATTAAAAC TGATGCTGGT CAAATATATA CAGGAACAAT TTGTCTGCAT GAAACAAGTG 360 

TTCATGTATA TAGAAATAAT CATGAAATAC CTAGAGATCA AAAGCATATG GAAATAAGAA 420 

TTGATGAAGT AACTACATCA GAAGAAGATA CAAAGAGTTT AGGTATTTCA GTAGGTGATT 4 80 

TTGTTAGCTT TGATCCACGT ACAGTTATCA CGTCATCAGG TTTTATTAAA TCTCGTCATT 540 

r5 TAGATGATAA AGCTAGCGTA CGgTtGATAC TACAATTACT AAAGAAATTA AAAGAAGAGC 600 

AAATAATATT ACCACATACA ACGCAATTTT ATATTTCTAA TAACGAAGAA ATAGGTTACG 660 

GTGCAAATGC ATCAATTGAT TCGAAAATCA AAGAATATAT TGCATTAGAT ATGGGCGCGT 720 

20 TGGGAGACGG TCAAGCATCG. GATGAATATA CAGTTTCTAT TTGTGCCAAA GATGCTTCAG 780 

GTCCATATCA TAAGCAATTG AAATCGCACC TAGTTAATCT TTGCAAAATA AATAACATTC 840 

CATATAAAGT AGACATATAT CCATATTATG GTTCAGATGC TTGAGCAGCT TTACATGCTG 900 

25 

GTGCGGATAT CAGACATGGT TTATTTGGCG CTGrGCATTGA ATCATCTCAT GCAATGGAAC 960 

GAACACATAT TGATTCTATT AAAGCGACAG AGAAATTACT AT ATGCAT AT TGCTTATCAC 1020 

CAATTGAGTA AACAATTAGT GTTGACAAAT GTGaACGACC TATGTAATAT AATGAACTAT 1080 

30 

AAAAATAATT AGAATTTTCT AAAGAAATAG TAGCAGATAT GAAACGTAGC AAATAGAAAG 1140 

CTAATGGGTG ATGGGAATTA GCACGCCATA TCTTGTGAAT TGGACTTTGG AAAACAATTG 1200 

AATGAGTTTT GAAAGTGAAC ATGAATTATG TTAACTAAGG TGGCACCACG GTAACGCGTC 1260 

CTTACAGGTA TATGCGTTAT GTGGTGTCTT TTTATTTAGA CAAAATGTAG TAGTTAATTA 1320 

AAGGTAGCAA CAGAAAGTTA GTGGATGATG TGAACTAACA CCGAGATTAA TGAAATTGGG 1380 

TTTTGTCTGC AACAGAAAAA TTATATATAG TAAAGAGTGA ACTATGAATA TTTCGAATAT 1440 

TCGGTTAATT TAGGTGGTAC CACGCGTCAC nTCCTTTATA TTGATAAGGA TGCTGGCGCT 1500 

TTTTTGAAAG GAGCGTATAG AATGGATATA TTTTATAAAA AAATAAAAGC AAATGTAACG 1560 

CCCGAAGTTT TAGCACAACT TCATTCCAAG AAGaTCATTT TGGAAAGTAC AAATCAACAA 1620 

CAAACTAAAG GTCGCTATTC AGTTGTTATT TTTGATATTT ATGGCACTTT AACTTTAGAT 16 80 

AATGATGTAT TATCAGTAAG TACTTTAAAA GAATCGTATC AAATCACTGA AAGACCGTAC 174 0 

CATTATTTAA CGACTAAnAT AAATGAAGAC TACCATAATA TTCCAAGATG AGGCAACTTA 1800 

AGTCATTA 1808 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1320 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 80: 

TGGTCGTCAA TTTCTTGATT ATATCTATAA TCCTCATTTT CAATATTAGA GTCTGTAGAA 60 

TCATCGATAT TATTATCATT CGCATGACTA GAAGCAGAAT CATTATTTTT ATCATTGCTT 120 

TCTTCTTTTT TGAAGTCTTT ATTTATCAAG TAAATTTCTT CATCAAAATC AGCTTGTTGA 180 

GATGTATCAT CTTTATTTTG ATTAGAAAAA TGTGTAGCCT TTGATCTTTT TCTTTGCCGT 240 

CTTTTCTTAG ATGTATTCCT CGTAAATAAT TCTAATTCAT CTTTATCTTC ATTTGATTCT 300 

TGTTGATCGT TCTTCGTTTT ATCATCCATC AATACTCACA CCCTTTAATA AGATGGTAAA 360 

TGGGCACGGA ATCTTTCAAT AAATTTCTCT CCACGCTCTT CAAAAGTACT ATATTGATCC 420 

CAACTCGCAC AAGCAGGTGA CAATAATACA ACATCATTTG GTTCTATAAT ATCTTGTACT 4 80 

TTATCAACAG CGTCTTCGAC ATTGTTCGCT TCAATGACCG ATTTCCCTTG ACTATTACCT 54 0 

AGTTTAGCAA ACTTAGCTTT CGTTTGTCCG AATACAACCA TCGCGCGAAC ATTTTCCATA 600 

TAAGGAATGA GTTCGTCAAA TTCATTCCCT CGATCCAAAC CACCACATAA CCAAATGATT 660 

GGTTGATTAA ATGAATTTAA GGCAAACTGT GTTGCTAGCG TGTTTGTTGC TTTGGAATCA 720 

TTATAATATT TATTAGTTCT ATTAGTACCA ACATATTGCA ATCTATGCTC TATTCCTGAA 780 

AATGTAGTTA AACTATCAAT AATTGCtTTA ATAGGTACAC CAGCanAATA CAAGCAAGCA 840 

CAGCTGCTAA TATATTTcTA AATTATGTTC ACCAGGCAAT ACTAGAtCTT CAGTGTTAAT 900 

AATadGAACA CCTTTATaAA CGATAAAACC ATCTTtAATA TAAaTACCAT CArCTtCTTG 960 

40 TTGAGTTGAG AAATACAATG TCTTAGCTTT TAATTCTTCC G ACT CT AT CA CTTGTCTTTG 1020 

ATGATAATTA CAAATCAAAT AATCCTCTTC CGTTTGATTT TTATATATTT GCTTTTTAGC 1080 

ATTTTGATAG TTTTCTAAAT TTTCATGGTA ATCTAGATGC GCCGAATAAA TGTTAGTAAT 1140 

TATAGCAATG TGTGGTTTAT ACTTTTCGAT TCCAAGTAAC TGGAATGACG ACAACTCTGT 1200 

AACTAAATAA TCTGTAGGCT TTACTTCTTG TGCTACTTTA GATGCAACAT AACCAATATT 1260 

GCCGGATAAT CTTCCAGTTA AGCGACTTTT TTTAAACATA TCTCCAATTA GAGAAGTAAC 1320 

(2) INFORMATION FOR SEQ ID NO: 81: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 42 80 base pairs 
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(C) STRANDEDNESS : double . 

(D) TOPOLOGY: linear 



!xi) SEQUENCE DESCRIPTION: SEQ ID NO: 81: 

TTTACACCAA TCAAAAAATC GAACTGATAT AAATAAGTAC AAAGCTTATC TATCAATCCG 60 

ATTTAGTTAT AAAACAAAAA AAGCCACAGT AATGTGGCTT TTTG TT AT AT TCAGTATCAA 120 

AATGGTATCA ATAGCCATTT TCGGAAGTCA AGAATGGCTT AACAACGCGG TTTAAAGCTA 180 

TCCAATACTA CCTTCCATTT CGAACTTGAT TAAACGGTTC ATTTCGACCG CGTATTCCAT 240 

15 TGGAAGTTCT TTTGTAAATG GTTCGATGAA TCCCATAACA ATCATTTCTG TCGCTTCTTC 300 

TTCAGAAATA CCACGACTCA TTAGATAGAA TAATTGTTCT TCAGAAACTT TTGAAACCTT 3 60 

GGCTTCATGT TCTAATGATA TTTGATCGTT GAATACTTCG TTATATGGAA TTGTATCTGA 420 

20 .' . . ' 

TGTTGATTCG TTATCTAAGA TTAATGTATC ACATTCAATA TTTGAACGAG CACCTTTTGC 480 

TTTACGTCCA AAATGAACAA TACCGCGATA AATAACTTTA CCACCATTTT TAGAAATAGA 540 

TTTAGAAACA ATTGTAGAAG ATGTATTAGG TGCTTTATGA ATCATTTTAG CACCGGCATC 600 

TTGAACTTGT CCTTTACCAG CAAATGCAAT AGATAATGTA CTACCTTTTG CACCTTCACC 660 

TAAAAGAACA CAGTTTGGAT ATTTCATCGT TAACTTAGAA CCTAAGTTAC CATCTACCCA 720 

TTCCATATTT CCGTTTTCAT AAACAAAAGT ACGTTTTGTA ACTAAATTGT ATACATTGTT 780 

30 

CGCCCAGTTT TGAATCGTAG TATAACGAAC GTGCGCATCT TTATGCACAA TGATTTCCAC 840 

AACAGCAGAG TGTAAAGAAC TAGTTGTATA AACTGGTGCA GTACAACCTT CTACGTAATG 900 

3S TACAGAAGCA CCTTCATCAG CAATGATTAA TGTACGTTCA AATTGACCCA TGTTCTCAGA 960 

GTTAATACGG AAATAAGCTT GTAGTGGCGT ATCTAGTTTG ATATTTTTAG GTACATAAAT 1020 

GAAGGAACCA CCTGACCATA CTGCTGAGTT TAACGCCGCA AATTTGTTAT CTGCTGCAGG 1080 

40 TACTACAGAA GCAAAGTATT TTTTGAATAA TTCTTCATTT TCTTGTAAAG CACTATCTGT 114 0 

ATCTTTAAAG ATAATACCTT TTTCTTCAAG TTCTTTTTCC ATATTATGGT AAACAACTTC 1200 

AGATTCATAT TGAGCAGAAA CACCAGCTAA ATATTTTTGT TCAGCTTCAG GAATTCCTAA 1260 

45 

TTTATCGAAA GTTCTTTTAA TTTCTTCTGG CACTTCATCC CATGAACGTT CAGCTTGTTC 1320 

TGAAGGCTTT ACATAGTAAG" TAATGTCATC GAAATTCAAT TCTGATAAGT CGCCACCCCA 1380 

TTGAGGCATT GGCATTTTAT AAAACAATTT TAATGATTTA AGACGGAAAT CTAACATCCA 144 0 

50 

TTCCGGCTCA TTTTTCATGT TAGAAATTTC TCTAACGATA TTCTCAGTTA AACCACGTTC 1500 

TGATCTGAAA ATGGACACAT CATCGTCGTG GAATC CAT AT TTATAATCCC CAACATCAGG 1560 
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TTTAATTCAT 


GATGTAAACC 


ATATTATAAC 


AATG ACATG A 


CATCTTATAA 


AAATTTTTAT 


1680 




ACTTTTATAT 


GTCTAATATC 


AAAATTATCT 


ATGATTAACA 


GCATTCTATT 


CTTCTTCAGT 


1740 


5 


CGTACCTTCT 


GCTTTACCTT 


CTTTAGCAAC 


AGTACCTTTT 


TCCAATGCTT 


TCCAAGCTAA 


1800 




TGTGGCACAT 


TTAATACGAG 


CTGGGAATTG 


AGATACACCT 


TGCAATGCTT 


CAATATCtCC 


1860 


10 


CATTTCTTCT 


GTAATCACAT 


AGTCTTCACC 


AAGCATCATT 


TTCGTAAATT 


CTTGGCTCAT 


1920 


TTGCATTGCT 


TCTCCAAGTG 


AATGACCTTT 


AACAGCTTGT 


GTCATCATCG 


ATGCACTTGC 


I960 




CATTGAAATC 


GAACAACCTT 


CACCTTCAAA 


CTTAGCATCT 


TTTATAATGC 


CGTCTTCTAT 


2040 


15 


ATCAAATGTT 


AGTCGTATAC 


GGTCACCGCA 


TGTCGGGTTA 


TTCATATCTA 


CTGTCATAGA 


2100 




CCCGTTATCT 


AATACAC CTT 


TATTTCTAGG 


ATTTTTATAA 


TGATCCATAA 


TGACAGATCT 


2160 




ATATAATTGA 


TCTAGATTAT 


TAAAATTCAT 


AAGAGAAAAA 


CTCCTTCGTT 


TGTTTCAAGG 


2220 


20 


CATTTATTAA 


CTGATCAACG 


TCTTCTTTCG 


TGTTGTATAT 


ATAAAAACTC 


GCTCTAGCTG 


2280 




TTGAAGACAC 


ATTTAACCAT 


TTCATTAACG 


GTTGCGCACA 


ATGATGCCCA 


GCTCTAACCG 


2340 




CTACACCTTC 


TGTATCTACG 


GCTGTAGCAA 


CATCGTGTGG 


ATGTACATCT 


TGTAAATTAA 


2400 


25 


ACGTTATTAC 


ACCTGCACGA 


CGATCCTTTG 


GCGGGCCATA 


AATTTCAATT 


CCTTCAATTG 


2460 




CAGACATTTG 


CTCATAAGCA 


TATATCGTTA 


ATTCTTGTTC 


ATATTTATGA 


ATTGCATCAA 


2520 




AACCTATGCG 


TTCTAAATAG 


CGAATAGCTT 


CTGCAAGCCC 


AATTGCTTGA 


GCAATTAATG 


2580 


30 


GAGTACCCGC 


CTCAAATTTA 


GTAGGTAAAT 


CAGCCCATGT 


TGCATCATAC 


TTACTTACAA 


2640 




AATCAATCAT 


GTGGCCACCG 


AACTCAATCG 


GTTCCATTTT 


TTGTAGTAAC 


TCACGTTTAC 


2700 


35 


CAAATAATAC 


GCCAATACCT 


GTTGGTCCAA 


GCATTTTATG 


ACCACTAAAA 


CTATAAAAAT 


2760 


CAGCATTCAT 


TTCTTGCATA 


TCAAGTTTCA 


TATGTGGTGC 


TGctTGCGCC 


CCATCAACAC 


2820 




TGATtSATTGC 


ACCATGTTGA 


TGAGCTATTT 


CTGCAATGGT 


TTTAACATCA 


TTAATTGTAC 


2880 


40 


CGAGCACATT 


AGATATATGT 


G CAAT AG CAA 


CGATCTTTGT 


TTTATCATTA 


ATCGTTTGCT 


2940 




TAATATCCTC 


GATGTTTAAT 


TCACCGTCAG 


CTGTCATTGG 


TATAAATTTC 


AATGTCGCAT 


3000 




TTTTACGCTT 


TGGTAACTGT 


TGCCAAGGAA 


CAATATTGGC 


ATGATGTTCC 


ATTTCAGTGA 


3060 


45 


CAACAATTTC 


ATCGCCCTCT 


TQAACATTTG 


CATCAC CAT A 


GCTATGTG CT 


n\-nf\\j\2 X i. /vrV 






TCGACGCAGT 


TGTTCCGCGT 


GTAAAAATGA 


TTTCTTCAAA 


ATACTTCGCA 


TTAATAAAAC 


3180 




GACGAACGGT 


TTCACGGGCA 


TTTTCATAAC 


CATCAGTTGC 


CAATGATCCT 


AATGTATGAA 


3240 


SO 


CACCACGATG 


AACGTTTGAA 


TTATAACGCT 


TGTAGTAATC 


TTCTAAAACA 


TTTAACACTT 


3300 




GCACAGGCGT 


TTGACTTGTC 


GCTGTTGAAT 


CAAGATATGC 


TAAACGTTTG 


CCATTGACTT 


3360 
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20 



25, 





AAPrTTTrTT 

K3-r\\~\— X X X V.- X X 


AA ATA AAA AT 


CCTAATCATT ' TAAATACTGA 


CGTTGTATTA 


3480 


GTCTTATA_C^ , 

\J X, w X X f\ X rW- v» 


AATATfYSAPA 


VJ X w X A X r\ X l» X 


ATTACAAACT 


TTTATTTTCA 


AAATATTATT 


* 3540 


T Af? A A A f'TTT 
1 111 


fSfYSTTPA AT* I ' 

U^-VJ X X X X 


nV* X l\«lvl IvA 


ATTGACGTTT 


AACGTCTTCG 


ATAGGTAATT 


3600 




TdfJATrTAAO 
X V?Vxn /viu 


A A A fV ATfVT A 
AAAI~*l_A ±\J Ln 


TAACAAGACG 


TTCCGCTTCT 


CTTTGAGAAA 


3660 




Ptt'P'I'l A AT 1 AC? 




CTGGATCAAC 


ACGACCTACT 


GATGCAGCAT 


3720 


f^APPAf^PTT^ 


lAWiiV^il V— X 


Tf* A TP A ATT A 
X LAlLnhl In 


ATAAAATAGG 


ATTCGCGTCA 


CCACGAGCAT 


3780 




LAI 


CGTGATTC CT 


GATTAGCAAT 


TGATTTAGTT 


wLnwLnluU X 


"*flAft 




f 7A T 7A 7A *PHP & 
^ift. I AC LAX XA 


74 A 1* A O 7A r* A /"V^ 


ATGCATGTTC 


TTTCATAACA 


A 1 1 *t 3* 1 ** I"'! ' A A ' 
VVnlVjX X livi 


•iqnn 




ATCTGTTTCT 


TTACCATATT 


GTACGATTTT 


AGATGTTAGA 


X lAni. X X ± X X 


J5DU 


GTT CGCCTGT 


ACCTACAACT 


ACTGATTTAA 


GTGAACTTGT 


TGAACGATCA 


/*■*/'■' A A TA T 1 A A AT* 

LLAAA1AAA1 


a ft 


TTGTTGTATT 


ATCAATAATT 


TGGCTACCCT 


CATTCATTAA 


ACCTAGTGCC 


CAATTAATTG 


4080 


AGGCATCCGC 


TTCAGTAATA 


CCACGTCGAA 


TGATATGACC 


TGTAAAGCCT 


TTATCCATAT 


4140 


AGTCCACTGA 


GCCATATGTG 


AT ATTTGAAT 


TTGCACCAGC 


AATCACTTCA 


GAAATAATAT 


4200 


TtAATTGATT 


TCCTTCACCA 


GATGCATTTG 


mTAAGTAATT 


TTCAACATAT 


GTGACTTCGG 


4260 


CGCTTTCTTC 


AGTAACGATG 










4280 



(2) INFORMATION FOR SEQ ID NO: 82: 

30 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 15598 base pairs 

(B) TYPE: nucleic acid 
EC) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

35 



~<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 82: 

TCnGACTCGA ACGGTGmAAC TAttCCGTTG TaATTCCgGA GgAAsCAAGG TATGCCCATC 60 

TGCaAAGAAA gaATGsAATG AACTTTTTGG AAATGTAGAA GTGGTAAATA AAGATAAAGG 120 

ATATTACATT CTGAGAAGTA TAAAAGCTTG AAATGAAATG GATATTCTGT TATAGTTATA 180 

TAATGTAAAA ATTTATGTTC AATAAGTGTG TACTTTTACG TTAAATAGAT AAGTTAATTA .240 

AGAATAAATA TAGAATCGAA AATGGTGTCA TCATTAGTGT TGCCGTTTTC TTTTTGTCTT 300 

TTTATTAATA TGCTTATGGT ATTTAGCTAA AAGCGGATCA CATAATTTTT GAGGGGTGAA 360 

TCTGTTTGGC AGGTCAAGTT GTCCAATATG GAAGACATCG TAAACGTAGA AACTACGCGA 420 

GAATTTCAGA AGTATTAGAA TTACCAAACT TAATAGAAAT TCAAACTAAA TCTTACGAGT * 480 
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CTGGTAATTT GTCATTAGAG TTTGTGGATT ACCGTTTAGG AGAACCAAAA TATGATTTAG 600 

AAGAATCTAA AAACCGTGAC GCTACTTATG CTGCAGCTCT TCGTGTAAAA ■ GTOCGTCTAA 660 

TCATTAAAGA AACAGGAGAA GTTAAAGAAC AAGAAGTCTT TATGGGTGAT TTCCCATTAA 720 

TGACTGATAC AGGTACGTTC GTTATCAATG GTGCAGAACG TGTAATCGTA TCTCAATTAG 780 

TTCGTTCACC ATCCGTTTAT TTCAATGAAA AAATCGACAA AAATGGTCGT GAAAACTATG 940 

ATGCAACAAT TATTCCAAAC CGTGGTGCAT GGTTAGAATA TGAAAGAGAT GCTAAAGATG 900 

TTGTATACGT ACGTATTGAT AGAACACGTA AACTACCATT AACAGTATTG TTACGTGCAT 960 

TAGGTTTCTC AAGCGACCAA GAAATTGTTG ACCTTTTAGG TGACAATGAA TATTTACGTA 1020 

ATACTTTAGA GAAAGACGGC ACTGAAAACA CTGAACAAGC GTTATTAGAA ATCTATGAAC 1080 

GTTTACGTCC AGGTGAACCA CCAACTGTTG AAAATGCTAA AAGTCTATTG TATTCACGTT 1140 

20 TCTTTGATCC AAAACGCTAT GACTTAGCAA GCGTGGGTCG TTATAAAACA AACAAAAAAT 1200 

TACATTtAAA ACATCGTTTA TTTAATCAAA AATTAGCTGA GCCAATTGTA AATACTGAAA 1260 

CTGGTGAAAT TGTAGTTGAA GAAGGTACAG TGCTTGATCG TCGTAAAATC GACGAAATCA 1320 

25 TGGATGTACT TGAATCAAAT GCAAACAGCG AAGTGTTTGA ATTGCATGGT AGCGTTATAG 1380 

ACGAGCCAGT AGAAATTCAA TCAATTAAAG TATATGTTCC TAACGATGAT GAAGGTGGTA 1440 

CGACAACTGT AATTGGTAAT GCTTTCCCTG ACTCAGAAGT TAAATGCATT ACACCAGCAG 1500 

30 

ATATCATTGC TTCAATGAGT TACTTCTTTA ACTTATTAAG CGGTATTGGA TATACAGATG 1560 

ATATTGAGCA TTTAGGTAAC CGTCGTTTAC GTTCTGTAGG TGAATTACTA CAAAACCAAT 1620 

TCCGTATCGG TTTATCAAGA ATGGAAAGAG TTGTACGTGA AAGAATGTCA ATTCAAGATA 1680 

35 

CTGAGTCTAT CACACCTCAA CAATTAATTA ATATTCGACC TGTTATTGCA TCTATTAAAG 1740 

AAMCTTTGG TAGCTCTCAA TTATCACAAT TCATGGACCA AGCAAACCCA TTAGCTGAGT 1800 

TAACGCATAA ACGTCGTCTA TGAGCATTAG GACCTGGTGG TTTAACACGT GAACGTGCTC 1860 

40 

AAATGGAAGT ACGTGACGTT CACTACTCTC ACTATGGCCG TATGTGTCCA ATTGAAACAC 1920 

CTGAGGGACC AAACATTGGA TTGATTAACT CATTATCAAG TTATGCACGT GTAAATGAAT .1980 

TGGGCTTTAT TGAAACACCA TATCGTAAAG TTGATTTAGA TACACATGCT ATCACTGATC 204 0 

AAATTGACTA TTTAACAGCT GACGAAGAAG ATAGCTATGT TGTAGCACAA GCAAACTCTA 2100 

AATTAGATGA AAATGGTCGT TTCATGGATG ATGAAGTTGT ATGTCGTTTC CGTGGTAACA 2160 

ATACAGTTAT GGCTAAAGAA AAAATGGATT ATATGGATGT ATCGCCGAAG CAAGTTGTTT 2220 

CAGCAGCGAC AgcATGTATT CCATTCTTAG AAAATGATGA CTCAAACCGT GCATTGATGG 2280 
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CAGGTATGGA ACACGTTGCA GCACGTGATT CTGGTGCGGC TATTACAGCT AAG CACAGAG 2400 
GTCGTGTTGA ACATGTTGAA TCTAATGAAA TTCTTGTTCG TCGTCTAGTT GAAGAGAACG • 2460 

GCGTTGAGCA TGAAGGTGAA" TTAGATCGCT ATCCATTAGC TAAATTTAAA CGTTCAAACT 2520 

CAGGTACATG TTACAACCAA CGTCCAATCG TTGCAGTTGG AGATGTTGTT GAGTATAACG 2580 

AGATTTTAGC AGATGGACCA TCTATGGAAT TAGGAGAAAT GGCATTAGGT : AGAAACGTAG 2640 

TAGTTGGTTT CATGACTTGG GACGGTTACA ACTATGAGGA TGCCGTTATC ATGAGTGAAA 2700 

GACTTGTGAA AGATGACGTG TATACTTCTA TTCATATTGA AGAGTATGAA TCAGAAGCAC 2760 

GTGATACTAA GTTAGGACCT GAAGAAATCA CAAGAGATAT TCCTAATGTT TCTGAAAGTG 2820 

CACTTAAGAA CTTAGACGAT CGTGGTATCG TTTATATTGG TGCAGAAGTA AAAGATGGAG 2880 

ATATTTTAGT TGGTAAAGTA ACGCCTAAAG GTGTAACTGA GTTAACTGCC GAAGAAAGAT 2940 

20 TGTTACATGC AATCTTTGGT GAAAAAGCAC GTGAAGTTAG AGATACTTCA TTACGTGTAC 3000 

CTCACGGCGC TGGCGGTATC GTTCTTGATG TAAAAGTATT CAATCGTGAA GAAGGCGACG 3060 

ATACATTATC ACGTGGTGTA AACCAATTAG TACGTGTATA TATCGTTCAA "AAACGTAAAA 3120 

25 TTCAIGTTGG TGATAAGATG TGTGGTCGAC ATGGTAACAA AGGTGTCATT TCTAAGATTG 3180 

TTCCTGAAGA AGATATGCCT TACTTACCAG ATGGACGTCC GATCGATATC ATGTTAAATC -3240 

CTCTTGGTGT ACCATCTCGT ATGAACATCG GACAAGTATT AGAGCTACAC TTAGGTATGG 33 00 

30 

CTGCTAAAAA TCTTGGTATT" CACGTTGCAT CACCAGTATT; TGACGGTGCA AACGATGACG - 3360 

ATGTATGGTC AACAATTGAA GAAGCTGGTA TGGCTGGTGA TGGTAAAACT GTACTTTATG 3420 

ATGGACGTAC AGGTGAACCA TTCGATAACC GTATTTCAGT. AGGTGTAATG TACATGTTGA 3480 

35 

AACTTGCGCA CATGGTTGAT GATAAATTAC ATCCGCGTTG 1 AACAGGACCA . TATTCACTTG 5 '354 0 

tTACACAACA ACCACTTGGC GGTAAAGGGC AATTCGGTGG ACAACGTTTT GGTGAGATGG 3 600 

AGGTATGGGC ACTTGAAGCA TATGGTGCTG CATACACATT ACAAGAAATC TTAACTTACA 3660 

40 

AATCCGATGA TACAGTAGGA CGTGTGAAAA CATACGAGGC TATTGTTAAA GGTGAAAACA 3720 

TCTCTAGACC AAGTGTTCCA GAATCATTCC GAGTATTGAT GAAAGAATTA CAAAGTTTAG 3780 

45 GTTTAGATGT AAAAGTTATG GATGAGCAAG ATAATGAAAT CGAAATGACA GACGTTGATG 3840 

ACGATGATGT TGTAGAACGC AAAGTAGATT TACAACAAAA TGATGCTCCT GAAACACAAA 3900 

AAGAAGTTAC TGATTAATAC GCAATTTACA AAACAGGCAA AAAGATACTA AGCTGAATTT 3960 

50 TATTGATGAT TCAGTTTAGT AGTTTAAGCC ATTTTAAATA AATGCAAATC AATCAAATAG 4020 

CAGAGCTAAT CTAAATTGAA GGAGGTAGGC TCCTTGATTG ATGTAAATAA TTTCCATTAT 4080 
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AAACCTGAAA CAATCAACTA CCGTACATTA AAACCTGAAA AAGATGGTCT ATTCTGTGAA 4200 

AGAATTTTCG GACCTACAAA AGACTGGGAA TGTAGTTGTG GTAAATACAA ACGTGTTCGC 4260 

5 TACAAAGGCA TGGTCTGTGA CAGATGTGGA GTTGAAGTAA CTAAATCTAA AGTACGTCGT 4320 

GAAAGAATGG GTCACATTGA ACTTGCTGCT CCAGTTTCTC ACATTTGGTA TTTCAAAGGT 4 380 

ATACCAAGTC GTATGGGATT ATTACTTGAC ATGTCACCAA GAGCATTAGA AGAAGTTATT 444 0 

10 

TACTTTGCTT CTTATGTTGT TGTAGATCCA GGTCCAACTG GTTTAGAAAA GAAAACTTTA 4500 

TTATCTGAAG CTGAATTCAG AGATTATTAT GATAAATACC CAGGTCAATT CGTTGGAAAA 4560 

ATGGGTGCAG AAGGTATTAA AGATTTACTT GAAGAGATTG ATCTTGACGA AGAACTTAAA 4620 

TTGTTACGCG ATGAGTTGGA ATCAGCTACT GGTCAAAGAC TTACTCGTGC AATTAAACGT 4680 

TTAGAAGTTG TTGAATCATT CCGTAATTCA GGTAACAAAC CTTCATGGAT GATTTTAGAT 4740 

20 GTACTTCCAA TCATCCCACC AGAAATTCGT CCAATGGTTC AATTAGATGG TGGACGATTT 4 800 

GCAACAAGTG ACTTAAACGA CTTATACCGT CGTGTAATTA ATCGAAATAA TCGTTTGAAA 4 860 

CGTTTATTAG ATTTAGGTGC ACCTGGTATC ATCGTTCAAA ACGAAAAACG TATGTTACAA 4920 

25 GAAGCOGTTG ACGCTTTAAT TGATAATGGT CGTCGTGGTC GTCCAGTTAC TGGCCCAGGT 4 980 

AACCGTCCAT TAAAATCTTT ATCTCATATG TTAAAAGGTA AACAAGGTCG TTTCCGTCAA 5040 

AACTTACTTG GTAAACGTGT TGACTATTCA GG ACGTT CAG TTATTGCAGT AGGTCCAAGC 5100 

30 

TTGAAAATGT ACCAATGTGG TTTACCAAAA GAAATGGCAC TTGAACTATT TAAACCATTC 5160 

GTAATGAAAG AATTAGTTCA ACGTGAAATT GCAACTAACA TTAAAAATGC GAAGAGTAAA 5220 

ATCGAACGTA TGGATGATGA AGTTTGGGAC GTATTGGAAG AAGTAATTAG AGAACATCCT 52 80 

35 

GTATTACTTA ACCGTGCACC AACACTTCAT AGACTTGGTA TTCAAGCATT TGAACCAACT 534 0 

TTACTTGAAG GTCGTGCGAT TCGTCTACAT CCACTTGTAA CAACAGCTTA TAACGCTGAC 54 00 

TTTGACGGTG ACCAAATGGC GGTTCACGTT CCTTTATCAA AAGAGGCACA AGCTGAAGCA 54 60 

40 

AGAATGTTGA TGTTAGCAGC ACAAAACATC TTGAACCCTA AAGATGGTAA ACCTGTAGTT 552 0 

ACACCATCAC . AAGATATGGT ACTTGGTAAC TATTACCTTA CTTTAGAAAG AAAAGATGCA 5580 

4S GTAAATACAG GCGCAATCTT TAATAATACA AATGAAGTAT TAAAAGCATA TGCAAATGGC 564 0 

TTTGTACATT TACACACTAG AATTGGTGTA CATGCAAGTT CGTTCAATAA TCCAACATTT 5700 

ACTGAAGAAC AAAACAAAAA GATTCTTGCT ACGTCAGTAG GTAAAATTAT ATTCAATGAA 5760 

50 ATCATTCCAG ATTCATTTGC TTATATTAAT GAACCTACGC AAGAAAACTT AGAAAGAAAG 5820 

ACACCAAACA GATATTTCAT CGATCCTACA ACTTTAGGTG AAGGTGGATT AAAAGAATAC 5880 
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GAAGTATTCA 


ACAGATT.TAG 


CAT CACTG AT 


ACAT CAATGA 


TGTTAGACCG 


TATGAAAGAC 


6000 




TTAGGATTCA 


AATTCTCATC 


TAAAGCTGGT 


ATTACAGTAG 


GTGTTGCTGA 


TATCGTAGTA 


6060 


5 


TTACCTGATA 


AGCAACAAAT 


ACTTGATGAG 


CATGAAAAAT 


TAGTCGACAG 


AATTACAAAA 


6120 




CAATTCAACC 


GTGGTTTAAT 


CACTG AAGAA 


GAAAGATATA ATGCAGTTGT 


TGAAATTTGG 


6180 


10 


ACAGATGCAA 


AAGATCAAAT 


TCAAGGTGAA 


TTGATGCAAT 


CACTTGATAA 


AACTAACCCA 


6240 


ATCTTCATGA 


TGAGTGATTC 


AGGTGCCCGT 


GGTAACGCAT 


CTAACTTTAC 


ACAGTTAGCA 


6300 




GGTATGCGTG 


GATTGATGGC 


CGCACCATCT 


GGTAAGATTA 


TCGAATTACC 


AATCACATCT 


6360 


15 




AAGGTTTAAC 


AGTAPTTf^AA 


TACTTCATCT 


CAACTCACGG 


TGCACGTAAA 


6420 




ATA PAG PACT 


TAAAACAGCT 


GACTCAGGAT ATCTTACTCG 


T CGTCTTGTT 


6480 






AAC5ATGTTAT 


TGTTfGTCAA 


GAAGACTGTG 


GTACTGATAG 


AGGTTTATTA 


6540 


20 




TTAAAGAAGG 


TACAGAAATG 


ATTGAACCAT 


TTATCGAACG 


TATTGAAGGT 


6600 




CGTTATTCTA 


AAGAAACAAT 


TCGTCATCCT 


GAAACTGATG 


AAAT AAT CAT 


TCGTCCTGAT 


6660 




GAATTAATTA 


CACCTGAAAT 


TGCTAAGAAA 


ATTACAGATG 


CTGGTATTGA 


ACAAATGTAT 


6720 


25 




CATTTACTTG 


TAACG CACGA 


CATGGTGTTT 


GTGAAAAATG 


TTACGGTAAA 


6780 




AACCTTGCTA 


CTGGTGAAAA AGTTGAAGTT 


GGTGAAGCAG 


TTGGTACAAT 


TGCAGCCCAA 


6840 






AACCAGGTAC 


ACAGCTTACA 


ATGCGTACAT 


TCCATACAGG 


TGGGGTAGCA 


6900 


30 




TCACACAAGG 


TCTTCCTCGT 


ATTCAAGAGA TTTTCGAAGC . 


: ACGTAACC CT 


6960 




a a & rzrzTC nXk.cz 

J-\J-\J-\\J\J L <~f\r\\J 


CGGTAATTAC 


GGAAATCGAA 


GGTGTCGTAG 


AAGATATTAA 


ATTAGCAAAA 


7020 




& T Af3 A P 21 2k P 


AAGAAATTGT 


TGTTAAAGGT 


GCTAATGAAA CAAGATCATA 


CCTTGCTTCA 


7080 


35 


Of^T* A PTT P XL A 


GAATTATTGT 


AGAAATCGGT 


CAACCAGTTC 


AACGTGGTGA 


AGTATTAACT 


7140 




GAAGGTTCTA 


TTGAACCTAA 


GAATTACTTA 


TCTGTTGCTG 


GATTAAACGC 


GACTGAAAGC 


7200 


40 


T AfTTATTAA 


AAGAAGTACA 


AAAAGTTTAC 


CGTATGCAAG 


GTGTAGAAAT 


CGACGATAAA 


7260 


CACGTTGAGG 


TTATGGTTCG 


ACAAATGTTA 


CGTAAAGTTA 


GAATTATCGA 


AGCAGGTGAT 


-7320 




ACGAAGTTAT 


TACCAGGTTC 


ATTAGTTGAT 


ATTCATAACT 


TTACAGATGC 


AAATAGAGAA 


7380 


45 


GCATTTAAAC 


ACCGTAAGCG 


TCCTGCAACA 


GCTAAACCAG 


TATTACTTGG 


TATTACTAAA 






GCATCACTTG 


AAACAGAAAG 


TTTCTTATCT 


G CAG CAT CAT 


TCCAAGAAAC 


AACAAGAGTT 


7500 




CTTACAGATG 


CAGCAATTAA 


AGGTAAGCGT 


GATGACTTAT 


TAGGTCTTAA 


AGAAAACGTA 


7560 


SO 


ATTATTGGTA 


AGTTAATTCC 


AGCTGGTACT 


GGTATGAGAC 


GTTATAGCGA 


CGTAAAATAC 


7620 




GAAAAAACAG 


CTAAACCAGT 


TGCAGAAGTT 


GAATCTCAAA 


CTGAAGTAAC 


GGAATAACAA 


7680 
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ATGTTGACGA ATTCTCTTGT TCAATGTTAA TATATTAAAG GTTGATGCAA GCAGAACTTT 7800 

GGAGGATAAA TTATTGTCTA AGGAAAAAGT tGCACGCTTT AACAAACAAC ATTTTGTAGT 7860 

5 TGGTCTTAAA GAAACGCTTA AAGCGTTAAA GAAAGATCAA GfTACATCTT TGATTATTGC 7920 

TGAAGACGTT GAAGTATATT TAATGACTCG CGTGTTAAGC CAAATCAATC ■ AGAAAAATAT 7980 

ACCTGTATCT TTTTTCAAAA GCAAACATGC TTTGGGTAAA CATGTAGGTA TTAACGTCAA 8040 

10 

TGCGACAATA GTAGCATTGA TTAAATGAGA ATTAGTAAGT GTTTTACTTA CTAAATTTTA 8100 

TTTAACCTAA AAATGAACCA CCTGGATGTG TGGGATTAAA AAGTGAAGAG AGGAGGACAT 8160 

is ATCACATGCC AACTATTAAC CAATTAGTAC GTAAACCAAG ACAAAGCAAA ATCAAAAAAT 8220 

CAGATTCTCC AGCTTTAAAT AAAGGTTTCA ACAGTAAAAA GAAAAAATTT ACTGACTTAA 8280 

ACTCACCACA AAAACGTGGT GTATGTACTC GTGTAGGTAC AATGACACCT AAAAAACCTA 8340 

20 ACTCAGCGTT ACGTAAATAT GCACGTGTGc gTtTATCAAA CAACATCGAA ATTAACGCAT 84 00 

ACATCCCTGG TATCGGACAT AACTTACAAG AACACAGTGT TGTACTTGTA CGTGGTGGAC 84 60 

GTGTAAAAGA CTTACCAGGT GTGCGTTACC ATATTGTACG TGGAGCACTT GATACTTCAG 8520 

25 GTGTTGACGG ACGTAGACAA GGTCGTTCAT TATACGGAAC TAAGAAACCT AAAAACTAAG 8580 

AATTTAGTTT TTAATTAAAT CTTAAACTTA AAATATTTAA TATAAGGAAG GGAGGATTTA 8640 

" CATTATGCCT CGTAAAG GAT CAGTACCTAA AAGAGACGTA TTACCAGATC CAATTCATAA 8700 

30 CTCTAAGTTA GTAACTAAAT TAATTAACAA AATTATGTTA GATGGTAAAC GTGGAACAGC 8760 

ACAAAGAATT CTTTATTCAG CATTCGAGCT AGTTGAACAA CGCAGgtTCG TGATGCATTA 8820 

* GAAGTATTCG AAGAAGCAAT CAAGAACATT ATGC CAGTAT TAGAAGTTAA AGCTCGTCGC 88 80 

35 - 

GTAGGTGGXT CTAACTATCA AGTACCAGTA GAAGTTCGTC CAGAGCGTCG TACTACTTTA 8940' 

GGTTTACGTT GGTTAGTTAA CTATGCACGT CTTCGTGGTG AAAAAACGAT GGAAGATCGT 9000 

TTAGCTAACG AAATTTTAGA TGCAGCAAAT AATACAGGTG GTGCCGTTAA GAAACGTGAG 9060 

40 

GACACTCACA AAATGGCTGA AGCAAACAAA GCATTTG CTC ACTACCGTTG GTAAGATAAA 9120 

AGCTTTTACC CTGAGTGTGT TCTATATTAA TGAATTTTCA TTAAGCX5TTC ATGCTTAGGG 9180 

45 CATCGCCATA TCTATCGTAT TTATTCAGTA ATATAAACTG GAAGGAGAAA AAATACATGG 9240 

CTAGAGAATT TTCATTAGAA AAAACTCGTA ATATCGGTAT CATGGCTCAC ATTGATGCTG 9300 

GTAAAACGAC TACGACTGAA CGTATTCTTT ATTACACTGG CCGTATCCAC AArGJcnGGTG 93 60 

SO AAaCACACGA AGGTGCTTCA CAAATGGACT GGATGGAGCA AGAACAAGAC CGTGGTATTA 9420 

CTATCACATC TGCTGCAACA ACAGCAGGTT GGGAAGGTCA CCGTGTAAAC ATTATCGATA 94 80 
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CAGTTACAGT 


ACTTGATGCA 


CAATCAGGTG 


TTGAACCTCA 


AACTGAAACA 


GTTTGGCGTC 


9600 




AGGCTACAAC 


TTATGGTGTT 


CCACGTATCG 


TATTTGTAAA 


CAAAATGGAC 


AAATT AGGTG - 


9660 


5 


CTAACTTCGA 


ATACTCTGTA 


AGTACATTAC 


ATGATCGTTT ACAAgCTAAC 


GCTGCTCCAA 


. 9720 




TCCAATTACC 


AATTGGTGCG 


GAAGACGAAT 


TCGAAGCAAT 


CATTGACTTA 


GTTGAAATGA 


9780 




AATGTTTCAA 


ATATACAAAT 


GATTTAGGTA 


CTGAAATTGA AGAAATTGAA ATTCCTGAAG " 


9840 


10 


ACCACTTAGA 


TAGAGCTGAA 


GAAGCTCGTG 


CT AG CTT AAT 


CGAAG CAGTT 


GCAGAAACTA 


9900 




GCGACGAATT AATGGAAAAA TATCTTGGTG 


ACGAAGAAAT 


TTCAGTTTCT 


GAATTAAAAG 


9960 


15 


AAGCTATCCG 


CCAAGCTa Ct 


AcTAACGTAG 


AATTCTACCC 


AGTACTTTGT 


GGTACAG CTT 


10020 


TCAAAAACAA 


AGGTGTTCAA 


TTAATGCTTG 


ACGCTGTAAT 


TGATTACTTA 


CCTTCACCAC 


10080 




TAGACGTTAA 


ACCAATTATT 


GGTCACCGTG 


CTAGCAACCC 


TGAAGAAGAA 


GTAATCGCGA 


10140 


20 


AAGCAGACGA 


TTCAGCTGAA . 


TTCGCTGCAT 


TAGCGTTCAA 


AGTTATGACT 


GACCCTTATG 


10200 




TTG GT AAATT 


AACATTCTTC 


CGTGTGTATT 


CAGGTACAAT 


GACATCTGGT 


TCATACGTTA 


10260, 




AGAACTCTAC 


TAAAGGTAAA 


CGTGAACGTG 


TAGGTCGTTT 


ATTACAAATG 


CACG CTAACT 


10320 


25 


CACGTCAAGA 


AAT CG AT ACT 


GTATACTCTG 


GAGATATCGC 


TGCTG CGGTA 


GGT CTT AAAG 


10380 




ATACAGGTAC 


TGGTGATACT 


TTATGTGGTG 


AGAAAAATGA 


CATTATCTTG 


GAATCAATGG 


10440 




AATTCCCAGA 


GCCAGTTATT 


CACTTATCAG 


TAGAGCCAAA 


ATCTAAAGCT 


GACCAAGATA 


10500 


30 


AAATGACTCA 


AGCTTTAGTT 


AAATTACAAG 


AAGAAGACCC 


AACATTCCAT* 


GGACACACTG 


r 1056 0 






TGGACAAGTT 


ATCATCGGTG 


GTATGGGTGA 


GCTTCACTTA 


GACATCTTAG 


, 10620 




. TAGACCGTAT 


GAAGAAAGAA 


TTCAACGTTG 


AATGTAACGT 


AGGTG CTCCA * ATGGTTTCAT 


10680 


35 


ATCGTGAAAC 


ATTCAAATCA TCTGCACAAG 


TTCAAGGTAA 


ATTCTCTCGT 


CAAT CTGGTG 


-1074 0 




GTCGTGGTCA 


ATACGGTGAT 


GTTCACATTG 


AATTCACACC 


AAACGAAACA 


GGCGCAGGTT 


10800 


40 


TCGAATTCGA 


AAACG CTATC 


GTTGGTGGTG 


TAGTTCCTCG 


TGAATACATT 


CCATCAGTAG 


10860 


AAGCTGGTCT 


TAAAGATGCT 


ATGGAAAATG 


GTGTTTTAGC 


AGGTTATCCT 


TTAATTGATG 


10920 




TTAAAGCTAA 


ATT ATATGAT 


GGTTCATACC 


ATGATGTCGA 


TTCATCTGAA 


ATGGCCTTCA 


10980 


45 


AAATTGCTGC 


ATCATTAGCA 


CTTAAAGAAG 


CTGCTAAAAA 


ATGTGATCCT 


GTAATCTTAG 


i n a a n 




AACCAATGAT 


GAAAGTAACT 


ATTGAAATGC 


CTGAAGAGTA 


CATGGGTG AT ATCATGGGTG 


11100 




ACGTAACATC 


TCGTCGTGGA 


CGTGTTGATG 


GTATGGAACC 


TCGTGGTAAT 


GCACAAGTTG 


11160 


50 


TTAATG CTT A 


TGT AC CACTT 


TCAGAAATGT 


TCGGTTATGC 


AACATCATTA 


CGTTCAAACA 


11220 




CTCAAGGTCG 


CGGTACTTAC 


ACTATGTACT 


TCGATCACtA 


TGCTGAAGTT 


CCaAAATCaA 


11280 



55 



537 



EP0 786 519 A2 





GCCTAGGTTA 


. AAATACAAGG 


TGAGCTTAAA 


. TGTAAGCTAT 


CATCTTTATA 


GXTTGATTTT 


11400 




TTGGGGTGAA 


, TGCATTATAA 


AAGAATTGTA 


AAATTCTTTT 


TGCATCGCTA 


TAAATAATTT 


11460 


5 


CTCATGATGG 


TGAGAAACTA 


TCATGAGAGA 


TAAATTTAAA 


TATTATTTTT 


AATTAGAATA 


11520 




GGAGAGATTT 


TATAATGGCA 


AAAGAAAAAT 


TCGATCGTTC 


TAAAGAACAT 


GCCAATATCG 


11580 


10 


GTACTATCGG 


TCACGTTGAC 


CATGGTAAAA 


CAACATTAAC 


AGCAGCAATC 


GCTACTGTAT 


11640 


TAGCAAAAAA 


TGGTGACTCA 


GTTGCACAAT 


CATATGACAT 


GATTGACAAC 


GCTCCAGAAG 


11700 




AAAAAGAACG 


TGGTATCACA 


ATCAATACTT 


CTCACATTGA 


GTACCAAACT 


GACAAACGTC 


11760 


IS 


ACTAOGCTCA 


CGTTGACTGC 


CCAGGACACG 


CTGACTACGT 


TAAAAACATG 


ATCACTGGTG 


11820 




CTGCTCAAAT 


GGACGGCGGT 


ATCTTAGTAG 


TATCTGCTGC 


TGACGGTCCA 


ATGCCACAAA 


11880 




CTCGTGAACA 


CATTCTTTTA 


TCACGTAACG 


TTGGTGTACC 


AGCATTAGTA 


GTATTCTTAA 


11940 


20 


ACAAAGTTGA 


CATGGTTGAC 


GATGAAGAAT 


TATTAGAATT 


AGTAGAAATG 


GAAGTTCGTG 


12000 




ACTTATTAAG 


CGAATATGAC 


TTCCCAGGTG 


ACGATGTACC 


TGTAATCGCT 


GGTTCAGCAT 


12060 




TAAAAGCTTT 


AGAAGGCGAT 


GCTCAATACG 


AAGAAAAAAT 


CTTAGAATTA 


ATGGAAGCTG 


12120 


25 


TAGATACTTA 


CATTCCAACT 


CCAGAACGTG 


ATTCTGACAA 


ACCATTCATG 


ATGCCAGTTG 


12180 




AGGACGTATT 


CTCAATCACT 


GGTCGTGGTA 


CTGTTGCTAC 


AGGCCGTGTT 


GAACGTGGTC 


12240 




AAATCAAAGT 


TGGTGAAGAA 


GTTGAAATCA 


TCGGTTTACA 


TGACACATCT 


AAAACAACTG 


12300 


30 


TTACAGGTGT 


TGAAATGTTC 


CGTAAATTAT 


TAGACTACGC 


TGAAGCTGGT 


GACAACATTG 


12360 




GTGCATTATT 


ACGTGGTGTT 


GCTCGTGAAG 


ACGTACAACG 


TGGTCAAGTA 


TTAGCTGCTC 


12420 


35 


CTGGTTCAAT 


TACACCACAT 


ACTGAATTCA 


AAGCAGAAGT 


ATACGTATTA 


TCAAAAGACG 


12480 


AAGGTGGACG 


TCACACTCCA 


TTCTTCTCAA 


ACTATCGTCC 


ACAATTCTAT 


TTCCGTACTA 


12540 




CTGAGGTAAC 


TGGTGTTGTT 


GACTTACCAG 


AAGGTACTGA AATGGTAATG 


CCTGGTGATA 


12600 


40 


ACGTTGAAAT 


GACAGTAGAA 


TTAATCGCTC 


CAATCGCGAT 


TGAAGACGGT 


ACTCGTTTCT 


12660 


CAATCCGTGA 


AGGTGGACGT 


ACTGTAGGAT 


CAGGCGTTGT 


TACTGAAATC 


ATTAAATAAT 


12720 




TTCTAATTTC 


TTAGATTTTA 


TATAAAAAGA 


AGATCCCTCA 


ATCGAGGGGt 


CTTrrTTTAA 


12780 


45 


TGTGTAAATT 


TTGTAATGGC 


TATTCGATTT 


AGAAGAACAA 


TAATTGATGA 




li!o4 U 




AATAAAACTT 


ATAACTGATA. 


ATACTGTTTA 


AATAAAATTG 


TTGAGTCTTG 


GACATTGTAA 


12900 




AATGCTCCCT 


TCAAAGTTTT 


CATTTTTTCa 


ATGTCTACTT 


TGAAGGGAGC 


ATTTCATTAG 


12960 


50 


TTTATGTCTC 


AGATTCATAT 


CTTTCAATTA 


ATTTAAATGC 


TTAATTTGTT 


TTAAATACTT 


13020 




GCTCTAATTC 


TATGATTTTT 


AAAAATACAG 


CTACAGCGTA 


TTTTAATGAT 


TTTTCATCAA 


13080 
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10 



15 



20 



TCAGAAAGAA TGCACCTGGT CGTACTTTCA AATAATGTGA AAAATCTTCT CCAATCATCA 13200 

TTAAATCTGA TTCATTAAAG CGTACATGTA AGTCATTTGT TGCTTCTTTA ATAACTTGAT 13260 

ATGCTTTCTC GTTATTATGG ACAGGCAAAT ACCCTTTAAT ATAATTCAAA TCATAGTTAA 13320 

TATCATTTGC TATTGCTAAA CCTTGTAGAA GCTTATCCAT TTTGTCCATT ACATGATTCT 13380 

GTATATCTGA ATCGAAAGTT CTAACTGTAC CTTTACAAAA TGCTTGATCA GGAATAACGC 1344 0 

TATCTGTGGT GCCTGCTTGA ATCATTCCAA ATGAAAGTAC AGCTTGTTTA ACTGGATCGA 13500 

TCGTACGTGA AATTATTTTT TGTG CACTTA AAATGAACTC TGCCATGATT ACTATTGGGT 13560 

CAATGGTTTC ATGAGGTTTG GCACCATGAC CACCACGACC TTTAAATGTG ACGCTAAATT 13620 

CATCTGGAGA GGCCATGATT GCCCCCGCAC GTGAATGAAT AGTTCCAGTA GGATAACCAC 13680 

TCCATAAATG TGTACCGTAA ATTCTATCTA CATTTTCCAG ACATCCAGCA TCTATCATTT 1374 0 

CTTGAGAACC ACCTGGCATG ATTTCTTCAC CGTACTGGAA TATTAATACA ACATTACCTT 13800 

CTAATAAATG TTTATGTTCA TCTAAAATCT CTGCTACAGT AAGTAAAATT GCTGTATGAC 13860 

CATCATGCCC ACACGCATGC ATACATCCTG GATTTTTAGA CTTATAAGGC ACATCGTTTA 13920 

2s ATTCCTCGAC AGGTAACGCA TCAAAGTCAG CTCTTAATGC AATGGTAGGT CCTGTGCCCA 13980 

AGCCTTTAAA TGTGGCTTTG ATACCATTGC GGCCGATAGG AGTTTCAATA TCACAAGATA 1404 0 

ACTGGCTTAA TTGGTTAACA ATATAATCAT GTGTTTGAAA TTCTTGAAAA GATAACTCAG 14100 

30 GATATTGGTG TAAATAACGT CTGAGTTGAA TTGTTTTATT TTCTTTATTA TTTG CTAGTT 14160 

GGAACCAATC TAACACCCTT ATCACTACTT TCTAAAATAA TGTTTATAGT ATAACATTTT 14220 

ATGAAATTAT CGTACTAAAT GATTGCTTTG - AGATATTTTA TCTATGAATG ATAAGGCTTT 14280 

55 CAAGTTATGT AGAATTACTG TATGATAAAG GTATTACCAA ACAATACTTA AGGGGGATTA 14340 

TATACTGTGG TTCAATCATT ACATGAGTTT TTAGAGGAAA ATATAAATTA TCTAAAAGAA 14400 

AATGGTTTGT ATAATGAAAT AGATACAATT GAAGGTGCAA ACGGACCAGA AATCAAAATC 14460 

40 

AATGGGAAAT CATACATTAA CTTATCTTCA AATAATTATT TAGGACTAGC AACAAATGAA 14520 

GATTTGAAAT CaGctGCAAA AGCAG CTATT GATACACATG GTGTAGGTGC AGGCGCTGTT 14580 

CGTACAATCA ATGGTACATT AGATTTACAC GACGAATTAG AAGAAACACT AGCAAAATTT 14640 

45 

AAAGGAACAG AAGCTGCAAT AGCTTATCAA TCAGGATTTA ATTGTAATAT GGCTGCTATT 14700 

TCAGCTGTCA TGAATAAAAA TGATGCTATT TTATCAGATG . AGCTTAATCA TGCATCAATT 14760 

SO ATTGATGGAT GTCGCTTATC TAAAGCTAAA ATTATTCGAG TTAACCATTC AGACATGGAT 14820 

GATTTACGTG CGAAAGCAAA AGAAGCAGTT GAATCAGGTC AATACAATAA AGTGATGTAT 14880 
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20 



25 



ATTGCAGAAG AATTTGGTTT ATTAACTTAT GTTGACGACG 
GGTAAAGGCG CTGGTACGGT TAAACATTTT GGTTTACAAG 
GGTACGCTTT CTAAAGCAAT TGGTGTCGTT GGCGGTTATG 
ATAGATTGGT TAAAAGCACA ATCACGACCA TTCTTATTCT 
GATACCAAAG CAATAACTGA AGCAGTTAAA AAGTTAATGG 
AAATTATGGA ACAATGCACA ATATTTAAAA AATGGATTGT 
GGTGAGTCAG AAACTCCAAT TACACCAGTA ATTATTGGTG 
TTTAGTAAGC GTTTAAAAGA CGAAGGTGTC TATGTGAAAT 
CCAAGAGGTA CAGGACGTGT AAGAAATATG CCTACAGCTG 
GATGAAGCAA TTGCGGCTTA TGAAAAAGTA GGAAAAGAAA 
TTTATTCCCA CGGCAAATAT TGTCGTGGGC TTTTTTTAAT 
(2) INFORMATION FOR SEQ ID NO: 83: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 661 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



CTCATGGTTC AGGTGTTATG 15000 

ATAAAATCGA TTTCCAAATA 15060 

TAGCAGGTAC AAAAGAGTTA 15120 

CTACATCATT AGCACCTGGG 15180 

ATTCAACTGA ATTACATGAT 15240 

CAAAATTAGG ATATGATACA 153 00 

ATGAAAAAAC AACTCAAGAA 15360 

CTATCGTTTT CCCAACAGTA 15420 

CACATACAAA AGACATGTTA 15480 

TGAAGTTOAT TTAATATTTA 15540 

GTTTAGTTTA TTAACAGT 15598 



30 



35 



40 



45 



SO 



Mxi) SEQUENCE DESCRIPTION: SEQ ID NO: 83: 

AAGTAAATCA ACTTACTGGG ATAAGAATAA AGG CG ATT AT AGTAACAAGT TGATTTTATT 60 

CGAMAACAT TTTGAAC CGG TTCTGGGTAT CAAGATGCAA CATAGTGGAG GTCATAGCTT 120 

TGGCCACACG ATTATTACGA TTGAAAGTCA AGGAGATAAA GCAGTTCATA TGGGTGATAT 180 

ATTCCCAACT ACTGCACATA AAAATCCTCT ATGGGTAACG GCATATGATG ATTATCCTAT 24 0 

GCAATCGATT CGTGAAAAAG AACGCATGAT AC CATATTTT ATTCAGCAAC AATATTGGTT 300 

CTTGTTTTAT CATGATGAAA ACTACTTTGC TGTAAAATAC AGCGATAATG GTGAAAACAT 360 

AGATGCATAT ATTTTACGTG AAACATTAGT TGATAATAAC TAAAATAAAG ATGTATTACT 420 

AAACAAATTT TCAAAAATAA AAAATTG AG C CACATCCAAT CTTACTAATT AGGGTGTGGC 480 

TCATTTTTAA GTTTTACgAT CCAAATCAAA TATGGaTAAA ATTCgTATTA ACGCTCTACa 540 

ATGtTAATGA CTTCACCAGT ATATGCATCT GCATAAAAAT CATAATGAAT ATTTTGACCA 600 

TTTTTAATAG TTGTAATTCC AC CTTGATAA ACTAAACGGT ATTTAT CAGT TTCAGGATGA 660 

A 661 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 573 8 base pairs 

(B) TYPE: nucleic acid a 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear,. 

(xi> SEQUENCE DESCRIPTION: SEQ ID NO: 84 : 

10 

GCAGACGGTA CAGCAGTTAA AGTCGCACCA AaACTGTAGT GAATcTAATC GGTGcATTCT 60 

TTTTAGGATT AGTTGTCGCG CTTATATATA TCTTCTTCAA AGTAATTTTC GATAAGCGAA 120 

TTAAAGATGA AGAAGATGTA GAGAAAGAAT TAGGATTGCC TGTATTGGGT TCAATTCAAA 180 

1S 

AATTTAATTA AGGATGGTTG CTACTTATGT CAAAAAAGGA AAATACGACA ACAACACTAT 240 

TTGTATATGA AAAACCAAAA TCAACAATTA GTGAAAAGTT TCGAGGTATA CGTTCAAACA 300 

20 TCATGTT TT C AAAAGCAAAT GGTGAAGTAA AGCG CTTATT GGTTACTTCT GAAAAGCCTG 360 

GTGCAGGTAA AAGTACAGTT GTATCGAATG TAGCGATTAC TTATGCACAA GCAGGCTATA 420 

AGACATTAGT TATTGATGGC GATATGCGTA AgcCAACACA AAACTATATT TTTAATGAGC 4 80 

25 AAAAXAATAA TGGACTATCA AGCTTAATCA TTGGTCGAAC GACTATGTCA GAAGCAATTA 540 

CGTCGACAGA AATTGAAAAT TTAGATTTGC TAACAGCTGG CCCTGTACCT CCAAATCCAT 600 
CTGAGTTAAT TGGGTCTGAA AGGTTCAAAG AATTAGTTGA TCTGTTTAAT AAACGTTACG . , 660 

30 ACATTATTAT TGTCGATACA CCGCCAGTTA ATACTGTGAC ' TGATGCACAA CTATATGCGC "720 

GTGCTATTAA AGATAGTCTG TTAGTAATTG ATAGTGAAAA AAATG ATAAr AATGAAGTTA 780 
AAAAAGCAAA AGCACTTATG GAAAAAGCAG . GCAGTAACAT TCTAGGTGTC ATTTTGAACA 840 

35 

AGACAAAGGT CGATAAATCT TCTAGTTATT ATCACTATTA TGGAGATGAA - TAAGTATGAT ; ' 900 
TGATATTCAT AACCATATAT TGCCTAATAT CGATGACGGT CCGACAAATG AAACAGAGAT 960 

GATGGATCTT TTAAAACAAG CGACAACACA AGGTGTTACA GAAATCATTG TAACATCACA 1020 

40 

TCACTTACAT CCTCGATATA CCACACCTAT AGAAAAAGTG AAATCATGTT TAAACCATAT 1080 

TGAAAGCTTA GAGGAAGT A C AAGCACTAAA TCTAAAGTTT . TATTATGGTC AGGAAATAAG 1140 

AATTACCGAT CAAATCCTTA ATGATATTGA TCGAAAAGTT ATTAACGGTA TTAATGATTC 1200 

45 

ACGCTATTTA CTAATAGAAT TTCCATCAAA TGAAGTTCCA CACTATACTG ATCAATTATt 1260 

TTTCGAATtA CAGAGTAAAG GCTTTGTACC GATTATTGCA CATCCAGAGC GGAATAAAGC 1320 

50 . AATAAGTCAA AACCTTGACA TACTATACGA TTTAATTAAC AAAGGTGCTT TAAGTCAAGT 1380 

GACAACGGcG T CATTAGCGG GTATTTCCGG TAAAAAAATT AGAAAATTAG CAATTCAAAT 1440 
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GTTCTTAATG 


AAAGACTTAT 


TTAATGATAA 


GAAATTACGT 


GATTATTATG 


AAGATATGAA 


1560 




CGGATTTATT 


AGTAATGCGA 


AGTTAGTTGT 


TGATGATAAA AAAATTCCTA 


AACGAATGCC 


1620 


s 


ACAACAAGAT 


TATAAACAGA 


AAAGATGGTT 


TGGGTTATAA 


ACAG CAAATG 


AGGGGTTTTA 


1680 




TGGCACATTT 


ATCTGTGAAA 


TTGCGGCTTT 


TAATACTAGC 


ATTAATCGAT 


TCACTGATAG 


1740 


10 


TGACATTTTC 


AGTATTCGTA 


AGTTATTACA 


TTTTAGAACC 


GTATTTCAAA 


ACATATTCTG 


1800 


TCAAATTATT 


AATATTGGCA 


GCTATATCAC 


TATTCATATC 


GCATCATATT 


TCaGCATTTA 


1860 




TTTTTAATAT 


GTATCATCGA 


GCGTGGGAAT 


ATGCCAGTGT 


GAGTGAATTG 


ATTTTAATTG 


1920 


1S 


TTAAAGCTGT 


GACGACATCT 


ATCGTTATTA 


CGATGGTGGT 


CGTGACAATT 


GTTACAGGCA 


1980 




ATAGACCGTT 


TTTTAGATTG 


TATTTAATTA 


CTTGGATGAT 


GCACTTGATT 


TTAATAGGTG 


2040 




GCTCAAGGTT 


ATTTTGGCGT 


ATTTATCGGA AATACCTTGG 


AGGTAAGTCA 


TTTAATAAGA 


2100 


20 


AGCCAACTTT 


AGTTGTTGGT 


GCTGGTCAAG 


CAGGTTCAAT 


GCTGATTAGA 


CAAATGTTGA 


2160 




AAAGTGACGA 


AATGAAACTT 


GAACCGGTAT 


TAGCAGTCGA 


TGATGACGAA 


CATAAACGCA 


2220 




ATATCACAAT 


TACTGAGGGT 


GTAAAAGTCG 


AAGGTAAAAT 


TGCGGATATT 


CCAGAACTAG 


2280 


25 


TGAGGAAATA 


TAAGATTAAA 


AAAATCATCA 


TTGCAATTCC 


AACTATTGGT 


CAAGAGCGTT 


2340 




TGAAAGAAAT 


TAATAATATT 


TGCCATATGG 


ATGGCGTTGA 


GTTATTGAAA 


ATGCCAAATA 


2400 




TAGAAGACGT 


CATGTCTGGT 


GAGTTAGAAG 


TGAACCAACT 


TAAAAAAGTT 


GAAGTAGAAG 


2460 


30 


ATTTACTAGG 


CAGAGATCCT 


GTTGAATTAG 


ATATGGATAT 


GATATCAAAT 


GAATTGACGA 


2520 




ATAAAACTAT 


TTTAGTTACG 


GGTGCAGGTG 


GTTCAATAGG 


ATCAGAAATT 


TGTAGACAAG 


2580 




TTTGTAATTT 


CTATCCAGAA 


CGTATTATTC 


TACTTGGCCA 


TGGTGAAAAC 


AGTATTTATT 


2640 


35 


TAATCAATCG 


TGAATTGCGA 


AATCGGTTCG 


GwAAAAATGT 


TGATATCGTT 


C CTATT ATAG 


2700 




CGGATGTGCA AAATAGAGCG 


CGTATGTTTG 


AAATTATGGA 


AACGTATAAA 


CCATACGCAG 


2760 


40 


TTTATCATGC 


AGCAGCACAC 


AAGCACGTGC 


CGTTAATGGA 


AGACAACCCT 


GAAGAAGCAG 


2820 


TACGTAATAA 


TATTTTAGGT 


ACGAAAAATA 


CTGCTGAAGC 


TGCTAAAAAT 


GCAGAGGTAA 


2880 




AGAAATTCGT 


TATGATTTCT 


ACGGATAAAG 


CCGTTAATCC 


GCCTAATGTC 


ATGGGAGCTT 


2940 


45 


CAAAGGGAAT 


TGCAGAAATG 


ATTATTCAAA 


GTTTAAATGA 


TGAAACGGAT 


CGAACAAATT 


3000 




TTGTTGCAGT 


GAGATTTGGT 


AATGTACTTG 


GATCGAGAGG 


ATCTGTGATT 


CCACTTTTCA 


3060 




AAAGTCAAAT 


TGAAGAAGGT 


GGGCCAGTTA 


CTGTGACACA 


TCCTGAAATG 


ACACGTTACT 


3120 


50 


TTATGACAAT 


TCCTGAAGCT 


TCTAGACTAG 


TTTTGCAGGC 


AGGGGCATTA 


GCAGAAGGTG 


3180 




GCGAAGTATT 


TGTGCTAGAT 


ATGGGAGAAC 


CAGTGAAAAT 


TGTAGATTTG 


GCACGTAATT 


3240 
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CCGGCGAAAA AATGTTTGAA GAGCTTATGA ATAAAGATGA GGTTCATCCT GAACAAGTAT 3360 

TTGAAAAAAT TTATCGTGGC AAAGTACAAC ATATGAAATG TAATGAAGTT GAAGCGATTA 3420 

5 TTCAAGACAT CGTCAATGAC TTTAGTAAAG AAAAAATTAT TAACTATGCC AATGGCAAAA 3480 

AGGGAGATAA TTATGTTCGA TGACAAAATT TTATTAATTA CTGGGGGCAC AGGATCATTC 3540 

GGTAATGCTG TTATGAAACA GTTTTTAGAT TCTAATATTA AAGAAATTCG TATTTTTTCA 3600 

10 

CGCGATGAGA AAAAACAAGA TGACATTCGA AAAAAATATA ATAATTCAAA ATTAAAGTTC 3660 

TACATTGGTG ATGTGCGTGA TAGTCAAAGT GTAGAAACAG CAATGCGAGA TGTTGATTAC 3720 

GTATTCCATG CAGCAGCTTT AAAACAAGTG CCGTCATGTG AATTCTTTCC AGTTGAGGCA 3780 

15 

GTGAAGACAA ATATTATTGG TACAGAAAAT GTCTTACAAA GTGCTATTCA TCAAAATGTT 3840 

AAAAAAGTCA TATGTTTATC TACAGATAAG GCAGOGTATC CTATTAATGC TAGGGGTATT 3900 

20 TCAAAAGCAA TGATGGAAAA AGTATTCGTA GCCAAATCAA GAAATATTCG TAGTGAACAA 3960 

ACGCTTATTT GTGGTACAAG ATACGGTAAT GTGATGGCTT CAAGAGGATC AGTAATACCT 4020 

TTGTTTATCG ACAAAATCAA AGCTGGAGAA CCTTTAACGA TTACAGATCC TGATATGACA 4080 

25 AGATTTTTAA TGAGCTTAGA AGATGCGGTA GAACTAGTTG TTCATGCATT TAAGCATGCA 4140 

GAGACAGGAG ATATTATGGT TCAAAAAGCA CCAAGCTCAA CGGTAGGGGA TCTTGCGACC 4200 

GCATTATTAG AATTGTTTGA AGCTGATAAT GCAATTGAAA TCATTGGTAC GCGACATGGA 4 260 

30 GAGAAAAAAG CAGAAACATT GTTGACGAGA GAAGAATACG CACAATGTGA AGATATGGGT 432 0 

GATTATTTTA GAGTGCCGGC AGACTCCAGA GATTTAAATT ATAGTAATTA TGTTGAAACC 4380 

GGTAACGAAA AGATTACGCA ATCTTATGAA TATAACTCCG ATAATACACA TATTTTAACG 4440 

35 

GTGGAAGAGA TAAAAGAAAA ACTTTTAACA CTAGAATATG TTAGAAACGA- ATTGAATGAT ■ 4500 

TATAAAGCTT CAATGAGATA GGAGAGATTG ACGTTGAATA TTGTAATTAC AGGAGCAAAA 4560 

GGTTTTGTAG GAAAAAACTT GAAAGCAGAT TTAACTTCAA CGACAGATCA TCATATTTTC 462 0 

40 

GAAGTACATC GACAAACTAA AGAGGAAGAA TTAGAGTCAG CATTGTTGAA AGCAGACTTT 4680 

GTCGTGCATT TAGCGGGTGT TAATCGACCT GAACATGACA AAGAATTCAG CTTAGGAAAC 474 0 

4S GTGAGTTATT TAGATCATGT ACTTGATATA TTAACTAGAA ATACGAAAAA GCCAGCGATA 4 800 

TTATTATCGT CTTCAATACA AG CAACACAA GATAATCCTT ATGGTGAGAG TAAGTTGCAA 4860 

GGGGAACAGC TATTAAGAGA GTATGCCGAA GAGTATGGCA ATACGGTTTA TATTTATCGC 4920 

50 TGGCCAAATT TATTCGGGAA GTGGTGTAAG CCGAATTATA ACTCAGTGAT AGCAACATTT 4980 

TGTTACAAAA TTGCACGTAA CGAAGAGATT CAAGTTAATG ATCGGAATGT TGAACTAACG 5040 
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ATTGAAAATG GTGTACCTAC AGTACCAAAC GTATTTAAAG TGACATTGGG AGAAATTGTA 5160 

GATTTATTAT ACAAGTTCAA ACAGTCACGT CTCGATCGAA CATTGCCGAA ATTAGATAAC 5220 

TTGTTTGAAA AAGATTTGTA TAGTACGTAT TTAAGCTATC TACCTAGTAC aGACTTTAGT 5280 

TAyCCCTTAC TTATGAATGT GGATGATAGG GGTTCTTTTA CAGAATTTAT AAAAACACCG 5340 

GATCGTGGTC AAGTTTCTGT AAATATTTCT AAACCAGGTA TTACTAAAGG TAATCACTGG 5400 

CATCATACTA AAAACGAAAA ATTTCTAGTC GTATCAGGTA AAGGGGTAAT TCGTTTTAGA 5460 

CATGTTAATG ATGATGAAAT CATtGAATAT TATGTTTCTG GCGACAAATT AGAAGTTGTA 5520 

GACATACCAG TAGGATACAC ACATAATATT GAAAATTTAG GCGACACAGA TATGGTAACT 5580 

ATTATGTGGG TGAATGAAAT GTTTGATCCA AATCAGCCAG ATACGTATTT CTTGGAGGTA 5640 

TAGCGCATGG aAAAACTGAA rTTAATGACA ATAGTTGGTA CAAGGCCTGA AATCATTCGT 5700 

20. TTATCATCAA CGATTAAAGC ATGTGATCAA TATtTTAA 5738 

(2) INFORMATION FOR SEQ ID NO: 85: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9062 base pairs 
25 (B) TYPE : nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear ' - ' 

'. ■ ' _ ■_ 

30 * ■ 5 ^ 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 65: 

. ATCATCAACA AGAATGATAT TTTTCCCATC TACTATATCT TTTACCGCAG ATAACTTCAC ' 60 

TCTCACACCT TGCTCACGTA ATTCTTGAGT TGGTTGAATA AATGTTCTTG CAACATATTG 120 

' ATTTTTAACT AGTCCCATTT CATATGGCAA ACCTATTTCT TCAGCATAAC CACTCGCAGC 180 

TGATAGCGAT gAATTGGGTA CACCGATGAC CATATCAGCA TTTACAGGGC TTTCTTGGGC 240 

TAATTTTTTA CCAGAAG CTT TACGTACTGC ATGGACATTT TTACCAGCTA TTGTTGAGTC 300 

40 t 

TGGTCTAGCA AAATAAATAT ATTCCATCGC AGAAATTGCA GTTGTCGTAT GATGTGTATA 3 SO 

AGATTTAACT GTAATACCTT TATCGTTAAT CACGACATAT TCACCTGCAT GAATATCTTG 420 

45 AACAAATTCT GCACCTAACA CATCTATTGC ACATGTTTCA CTTGCAAGGA TGTATGTCCC 480 

ATCTTTCATT TTACCTACAA CAAGTGGTCT GATAGCATTT GGATCTACTG CGCCATATAA 540 

CGCATCTTTA GTTAAAATCG CAAATGTAAA ACCGCCTTTA ACTTTTCGCA AACTTTCTTT 600 

60 CAACGCTTCC TCAAAAGTAG GAGCTTTACT TCGACGTATC AAATGCATAA TGACTTCAGT 660 

ATCAGAAGAC GAATGGAAGA TAGCACCTTG TTTTTCTAAA TTCTGACGCA ATGATTTAGC 720 
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CGGTTGAATA TTTTCAATAC CTTTATTACC TGAAGTAGCA TAACGGACGT GACCAATTGC 840 

ATGTTGATAT CCTTTTAATG GTTCCATTTG ATCATCTTTA ATCGCTTCAG TTAGTAAGCC • -900 

TAATCCTCGC TCGCCTTTTA ATTCATTTTG ATCAGAAACA ACTATACCTG cACCTTCTTG . . 960 

ACCACGATGT TGCAAACTAT GAAGTCCCAT ATAtGTTAGT TGCGCTGCtT CaGGATGATT 1020 

CCAAATACCA AACACGCCAC ATTCTTCGTT TAATCCTGAG TAGTTAAACA . TTGaGCAATT 1080 

GCCCCtTCCC ATATTTGTTT AATATCTGAA ACATTTTCAC TAATCTCTGT aTATGGTGTT 1140 

GTTACCTTGr aATTATCACT ATCTGTTAAA AGTCCAATTT CTATTGCATT ATCAATATTT 1200 " 

AAAGTTTTAC CTGATTTAAC AGAAACAACA TATCGGCCTT GCGTCTCACT AAACAATTGT 1260 

GCATTTGTTA TATCTATTGA AGATTTTAAT CCTAAAGCGT AATGCGCACT TAGTTTAGCT 1320 

AAGGTAATCA GTAAGCCACC TTTACCAACT GTTTGAACAT GTGATAATAG TCCTTCACGA 13 BO 

ATAGCGGTCT TGATTGATTC ACCTTTTTCA ACTTCTGAAC TCAAATCTAA TGACTCAAAT 1440 

TCATGATTAA CTTTGCCATA AATTAACTTT TCAAGTTGAC TACCACCAAA GTCGTCCTTA . 1500 

GTATCACCGA TTAAATATAA TTTATCTCCA ACTTGAGGTT CAAAATCATT TAAATAATTT , 1560 

ACATTTTCAA TCAAACCTAG CATTCCAACA ACTGGTGTTG GGAAAATAGA AGTACCTTTC 1620 

GTTTCGTTAT ATAAAGATAC ATTACCAGAA ACTACTGGTG TCTTAAGAAT GTCGCATGCT 1680 

TCTGCCATAC CTTTCGTTGA ATCTATCAAC TGTTGATAGA TTTCTTTCTT TTCAGGAGAA 1740 

CCATAATTTA AACAATCTGT CATTGCTAAT GGTGTTGCAC CCACGGCAAT TAAATTTCGA 1800 

TAAGCTTCAG CTACTACCAT CTTTCCACCT TCATATGGAT TGTTATATAC, ATAACGCGCT i860 

TCACCATCAA TTGTTGAAGC AATTGCCTTA . TTTGTGCCTT CCACACGTAC TACCGATGCT . ' 1920 

TGAAGTCCTG GCTTAATTAT CGTATTGGCA CCAACTTGTT GGTCGTATTG" ATCATATAAA • v 1980 

TAGTGTTTAG ATGCTATAGT CGGATGCTTA AGTAATTTAA AGAAAGTATG TTTAACATCG . 2040 

ATGTGTGTAT AATCATTTTT AGAAGTATTA TAATCTTTTT CTTCTCCTTC TAAAATATAT 2100 

ACAGGTGCTT CATCAGCTAG TGGTTCAACT GGAATGTCAG CATAAACTTC GT CAT CAT AT 2160 

GTTAAAACAA AACGATTTGT ATCTGTAACT TCACCTATAA CAGCACTATC CAATTCGTGC 2220 

45 TTATCAAATA AATCTAAGAA TTTTTGTTCA GTACCTTTTT CAACAACTAG TAACATACGT . 2280 

TCTTGAGTTT CTGAAAGCAT CATTTCATAA GGAGAAATAC CTGGCTCACG TGTTGGCACT 234 0 

TGTTCTAATC TCAAATGTAA CCCACTACCA CCTTTTGCCG CCATTTCAGA CGATGAAGAT 2400 

SO GTTAAACCAG CAGCACCCAT ATCTTGAATA CCAACTAATT CATCAAATGT AATTGCTTCA 2460 

AGTGTTGCTT CCATTAATTT TTTAC CTACA AATGGATCAC CGATTTGTAC AGAAGGTCGT 2520 
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CGACCAGTTT TCAAACCAAC ATAAATGACC GAATTACCTA CACCTTTTGC TGTGCCTTTT 2 64 0 

TGAATCATGT CGTGATTGaT AACACCAACA CACATTGCAT - TAACAAGTGG ATTGCCATCA 2700 

5 TAACGTTCAT CAAATTCGAT TTCACCAGCA GTTGTTGGaA TACCAATGCA GTTACCATAA 27 60 

CCTCCGATAC CCTTTACAAC ACCTTTAAGT AATCTTTGGT TTTGTTTATT ATCTAATTCT 2 820 

CCAAATCTAA GACTGTTTAA CAAATTAATA GGTCTAGCCC CAATAGAGAC AATGTCACGA 2880 

10 

ATGATTCCAC CAACGCCTGT AGCAGCCCCT TGATATGGTT CAATTGCTGA TGGATGATTG 294 0 

TGAGACTCTA CTTTAAATAC TACGGCTTGA TTATCACCTA TATCGACTAC CCCTGCACCT 3000 

TCACCAGGCC CCATAAGCAC ATGGTcACCT GACGTAGGAA ATTGCTTTAA AAACGGTTTA 3060 

15 

GAATGTTTAT AAGAG CAATG TTCACTCCAC ATAACAGAAA AGATACCTGT TTCTGTAAAG 3120 

TTAGGTTGTC TGCCTAAAAT ATCGCAAACT TTTTCATATT CTTGATCaCT TAATCCCATA 3180 

20 TCTTGATATA CTTTTTCAAG TTTAATTTCT TCAACGCTTG GTTCGATAAA TTTAGACATG 324 0 

TTGTTCCCTC CAACTTTTTA CCATCGCTTC AAATAATTTC ACACCACTAT CAGTACCTAA 3300 

CAACGTTTCT AAAGCTCTTT CagGATGtGG CATCATGCCA CATACATTGC CTTTTTCGTT 3360 

25 AACAATTCCT GCAATATCAT CATATGAACC GTTCGGATTA TTCACATATT. TCAGAATAAT 3420 

TTGATTGTTA GCTTTTAATT GTTGATATAT TTCATCAGTA CAATAATAAT GACCTTCACC 34 80 

GTGAGCTACA GGATATATAA CTTTTTCACC TTGTTCATAA AGATTTGTAA ATGC CGTTTG 3 54 0 

30 ATTATTCACT ATTTCTAACT CTTCATTTCT ACTAATAAAT AAATGTGAAT CGTTATG CAA 3600 

TAATG CACCA GGTAATAAGC CTATTTCAGT T AAAATTTG A AACCCATTAC AAACACCTAA 3660 

TACTGGCTTA CCTTCAGCTG CAAGACGTTT AACTTCCGAA ATAATCGGsG CTACACTAGC 3720 

35 

CATTGCCCCA GATCTTAAGT AATCC CCGAA TGAAAATCCA CCAGGAATAA GTACGCCATC 3780 

AAATeCAGTT AGTGATGTTT CTCTATAATC TACATATTCC GCTTCAACAC CACTTTTAAT 3840 

AGCAGCATTA AACATGTCTC TATCACAATT CGAACCTGGA AAAACAAGAA CCGCAAATTT 3900 

40 

CATTTTATGC ATTCTCCTTT TCATGATCTA ACACTTTATA GCTATATTCT TCAATCACTG 3960 

TATTTGCAAA CAATTTTTCA CTTAGAGTTG TAATAATGTT GTCTACCTTT TCATCACTAA 4020 

45 CCTCATCCAC TGTCATATAT AATACTTTTC CTACACGAAT ATCATTCACT TGTGCATAAC 408 0 

CTAAGTCATG TACAGCTCGA GTAAGCGTTT GTCCTTGCGT ATCTAATACT TGTGGTTGTA 414 0 

ATGTGATATG TAGTTCAATT GTTTTCATTA TTTTAAATCC TCCAATTTGT TTAAAAATAT 4200 

SO TTGATATGTT TCAATCAGTG ATCCAGTGTT ATTTCTATAT AGATCTTTAT CAAAGTTTGC 4260 

ATTGGT AG CT TTAT CCCAAA TTCGACATGT ATCTGGAGAT ATTTCATCCG CTAACAAAAT 4320 
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ATCCATTAAT TGTTTCAACA CATTATTAAT CTTTAATGCT TTGGATTTTA GTATTTCAAT 4440 

ATCTTCATCT GATG CT AT AT TGAGCAATTT AACATGGTCA TCCGTTATCA ACGGATCATT 4500 

5 TAACGCATCA TTTTTATAGA AAAATTCTAC AAGTGGTTCT CTAAAAACTT CACCATTTTC 4560 

AAAACCTAAA CGCTTTGTAA TAGATCCACT AGCAATATTA CGAACAACTA CTTCTAATGG 4620 

AATTATTTTC ACAGGCTTAA CTAATTGTTC TGTTTCAGAT AATTGTTTAA TAAAGTGACT 4680 

10 

TTCTATTCCA TTTTCTTGTA AATATTTAAA TATAATAGAA GTAATTTGAT TATTTAATCG 4740 

CCCCTTACCT GCCATTGTGT CTTTCTTAGC CCCGTTTCCA GCAGTAACTT CATCTTTATA 4800 

TTCAACTCTT AATTCATTTT CTTGATTTGT TGAGAAAATG CGcTTCGCTT TTCCTTCATA 4860 
15 ' 

TAATAATGTC ATGCTTTAAT TACTCCCCTC AAATTTAGCG TACATATCTT GTTCAGTTTG 4 920 

GTTTACATCA TTCGTTAGTA CAGTCATATG CCCCATTTTT CTGCTATCTT TACGCTCAGA 4 980 

- } 

CTT AC CAT AA ATATGTAAGT GCCACTCTGG ATGTTCATTA AATTCATTTT CCAATAAATC 5040 

20 

TAAATCTTTA CCTAGTAAGT TCATCATGAC TGCTGGCTTT AATAATTCAA TTGAATTTGG 5100 

TAATGATTGT CCGGTAACTG CTAAAATATG - AGTATCAAAT TGTGAATAAT CACATGCTTC 5160 

25 AATTGAATAA TGTCCGGAAT TGTGAGGCGT TGGTGCTATC TCGTTCACAT ACAATTGGTT . 522 0 

GTTACTATCT ATAAAAAATT CAACTGTAAA TGTTCCAATG AAATGAATCG ATTGGATAAT 52 80 

TTTATTAACT TGCTCTTTCG CCTCAGCTGT TTTATCTATT CTCGCTGGAA CAATTGTTTT 5340 

30 GAAAAGTATT TGATTTCTAT GCTCATTTTC TTGTAATGGG AAAAAAGTGA : TTTGATTGTT 54 00 

GTTTCCTCTT GTAACAGTAA GAGATACTTC TTTCTTGATA TTCAAATATT TTT GAG CT AC 5460 

GCATTCACTA GTTTCAATTA ATTTAAAACC TTCTTGTAAG ' TCTTTTTCGT TGTTAATTAA 5520 

35 AACTTGACCT TTGCCATCGT AGCCACCAAA TCTAGTTTTT ACAATAAAAG GATATC CTAA 5580 

TGTl^CAATT GCTTTGTCAA TATCTGTAGA TTCTTTT ACT GAAATGAACG GGACAACTTT 564 0 

GGTACCAGCA CTTTTTAATG TTTCTTTTTC AGTTAAG CG A TCTTGTAATA ACTGTATAGC 5700 

40 

TTGGTAACCT TGCGGAATAT TGTACTTTTC ACATAATAGT TTTAATTGTT GGGCTGAAAT 5760 

GTTTTCAAAT TCATAAGTAA TCACATCACA TTTTTGTCCT AATTGATTGA GTGCCTTTTC 5820 

ATCGTCATAC TTGGCTTGTA TAAATTCGTG TGCAACGTAT CTACATGGAC AATCTTCAGA 5880 

45 

AGGATCCAAT ACAACCACTT TATAACCCAT TTTTTGAGCT GATTGTGCCA TCATCTTTCC 594 0 

AAGCTGACCA CCACCAATAA TGCCAATAGT CGCACCAAAC TTTAATTTAT TGAAGTTCAT 6000 

50 TTTGCATGTC CTCCACTTTT TGAATTAACG AAGATTCATA CTGATTTAGT TTTTCAACTA 6060 

AAGAAGGATT TTGAATACTT AACATTCTTG CTGCAAGTAT ACCTG CGTTT TTAG CACCTG ' 6120 
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AAGAATCTAT 


, acCCTTTAAA 


CTTTTTGTTT 


CAATCGGCAC 


TCCAATAACT 


GGTAGCGTCG 


6240 




TTAATGATGC 


AACCATACCT 


GGTAAATGTG 


CCGCACCGCC 


AGCGCCTGCA 


ATGATAATGT 


6300 


s 


TTATACCTCT 


TTCTCTCGCT 


TCAGAAGCAA 


ATTGAACCAT 


CATTTTTGGC 


GTACGATGTG 


6360 




CGGATACTAC 


TTGTTTTTCG 


TACGGAATTT 


CAAAATAATC 


CAACATGTTA 


CAACTCTCTT 


6420 


10 


GCATAATTTT 


CCAATCGGAA 


GAACTGCCCA 


TAATGACTGC 


TACTTTCACT 


TTGTACACCC 


6480 


TTTCAAAAGT 


TTGAATTGTG 


AATTACTTTA 


GTTGTATATT 


ATAGATATAG 


GATAACAAGC 


6540 




AATTTCTGCT 


TTTTCAATCA 


AAAATCGAAC 


TTTATTTTGA 


TTTTTTATTT 


GAATTTACGT 


6600 


15 


CTTTTGCTAT 


GTAAATTAGT 


TTTATAAACT 


AACAAAGTTA 


GGATATTGAC 


AAXAGGAGGA 


6660 




GAAGTTTTTA 


TGGTTGGTAA 


AATTTTAGAT 


GGTAAACAAA 


TTGCCAAAGA 


CTACAGACAG 


6720 




GGGTTACAAG 


ATCAAGTTGA 


AGCGCTAAAA 


GAAAAGGGTT. TTACACCTAA 


ATTATCCGTT 


6780 


20 


ATATTAGTTG 


GTAATGATGG 


CGCTAGTCAA 


AGTTATGTTA 


GATGAAAAAA 


GAAAGCAGCT 


6840 




GAAAAAATTG 


GTATGATTTc 


AGAAATCGTA 


CATTTGGAAG 


AAACAGCTAC 


TGAAGAAGAA 


6900 




GfATTAAACG 


AACTAAATAG 


ACTAAATAAT 


GATGATTCTG 


TAAGTGGTAT 


TTTGGTACAA 


6960 


25 


GTACCATTAC 


CAAAACAAGT 


TAGCGAACAG 


AAAATATTAG 


AAGCAATCAA 


TCCTGAAAAA 


7020 




GATGTGGACG 


GTTTTCATCC 


AATAAATATA 


GGGAAATTAT 


ATATCGATGA 


ACAAACTTTT 


70.80 




GTACCTTGCA 


CACCGCTCGG 


CATCATGGAA 


ATATTAAAAC 


ATGCTGATAT 


TGATTTAGAA 


7140 


30 


GGTAAAAATG 


CAGTTGTAAT 


TGGACGAAGT 


CATATTGTCG 


GACAACCAGT 


TTCTAAGTTA 


7200 




GTACTTCAAA 


AAAATGCATC 


AGTAACAATC 


TTACATTCTC 


GTTCAAAAGA 


TATGGCATCA 


7260 




TATTTAAAAG 


ATGCTGATGT 


CATTGTCAGT 


GCAGTTGGTA 


AGCCTGGTTT 


AGTAACAAAA 


7320 


35 


GATGTGGTCA 


AAGAAGGAGC 


AGTAATTATC 


GATGTTGGCA 


ATACGCGAGA 


TGAAAATGGC 


7380 




AAAXTAAAAG 


GTGACGTTGA 


TTATGATGCG 


GTTAAAGAAA 


TTGCTGGAGC 


TATTACACCA 


7440 


40 


GTTCCTGGTG 


GCGTTGGTCC 


ATTAACAATT 


ACTATGGTAT 


TAAATAATAC 


TTTGCTTGCA 


7500 


GAAAAAATGC 


GTCGAGGTAT 


TG ATT C G T AA 


AGAGCCTGAG 


ACATAAATCA ATGTTCTATG 


7560 


c 


CTCTACAAAG 


TTATAATGGC 


AGTAGTTGAC 


TGAACGAAAA 


TTCGCTTGTA 


ACAAGCTTTT 


7620 


45 


TTCAATTCTA 


GTCAACCTTG 


CCGGGGTGGG 


ACGACGAAAT 


AAATTTTACG 


AAAATATCAT 


/ o o u 




TTCTGTCCCA 


CTCC CTAATA 


ACTGAGTTTT 


AATGAAGTCT 


TTTAACCCAC 


ATTAAATATT 


7740 




ATTTTGCAAT 


TGCAATGAAT 


AACAAGAAAA 


ATCTGGGACA 


TTAATCGATC 


AAATGCTCCC 


7800 


SO 


TTCAAAGTAG 


ACATTGAATA 


AATGAAGGCT 


TTGAAGGGAG 


CATTTCACTT 


TGTACTTGGC 


7860 




TCAACAATTT 


TATATAGACA 


GTAGTTAATT 


GAATGAAAAT 


AAGCTTGTAA 


CAAGTTTTCA 


7920 
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ul XvjvivjrijAAvj 






C ft rwpaTT ATA 
v*A.^ iAlunln 


A A f3T AtTTACT 


ACAT AG TT AA 


8040' 






TTCTTTATCA 


1111 LvsLl. A w 


V-V- 111 IClln 


TTf3* i " i - i"l'GAT 

X 1 u X X X X w»* 


ACACAAAAAT 


8100 


s 


TTAAGTTCAA 




& A A C2TT AT AT 


1 lutnl 1 x V*rtn 


ATTATCCCTA 


AATTATTAAT 


8160 








Tf^A. & & AT A AT 


nnl 1A1 1 1 (v^- 


TC ATTATTTA 

X V— /"IX X«^X X x^v 


TAAATTTATA 


8220 


10 


TTTAAATTTC 


ATTCTTTATA 


IjrLnj 1 Arvj/i 1 1 


>VjvjAv_ X A 1 


T A Tfi ATfiTGT 

1 rt, X Vjn X VJ A \J X 


ArATAATATA 


8280 


AATTAAGGTA 


TAGTAAAGCT 


31 JA /^•T'/'^ TV /""* TV 7\ 7A 


TGACTTATCA 


TTCGGAGGTT 


ACATTATGAA 


8340 




TAAACTATTA 


CAGTCAX XAT 


TV /*» *T»f*W' s, 

v~A(?L,UV~ X Laj\j 


TGTTTCTGCT 


ACACTAGTAA 


CACCAAATTT 


8400 


15 


AAATGCAGAT 


GCAACGACGA 


ATACTACACC 


ACAAATTAAA 


GGCGCTAATG 


ATATPRTTAT 


8460 




TAAGAAAGGT 


CAAGATTATA 


ACCTTCTAAA 


CGGCATAAGT 


GCATTTGATA 


IV AR AAflATOf; 






AGATTTAACC 


GATAAAATTA 


AAGTCGATGG 


CCAAATTGAT ACATCTAAAT 


r'TryiTa a at a. 


aeon 


20 


TCAAATTAAA 


TATCATGTCA 


CTGATTCAGA 


TGGTGCAATT 


AAAATTTCCA 


Im. lAuvjlnlnl 


oo*u 




TGAGGTTAAA 


TAGCCCTCAT 


CACTATACTG 


CAAATAAAAT 


GGTAGCAAAC 


uAALA 1 o X 1 X 


o / uu 




TGCTACCATT 


TTATTTGTTA 


TTCTAACTTC 


ATCTGCAACT 


TTAACCCAAA 


TA TTGTATTT 


O. r O V 


25 


TTTCTGTATA 


CCAAAGGACT 


AC CTATCAAA 


TTATTAAAAC 


TTAACTGCTC 


TTTTTAAAAA 


q a *y n 




AATGTTTTGA 


TTTTGAACAA 


ACAAATTTCC 


ACTTTTCATT 


GTTTAACGAT 


AAATTACTTT 


8880 




TGGCAAATTC 


CTTATTAAAA 


TGTTTGCGCT 


TCCTTTCAAT 


CAACTAGCCA 


TCATTTTCAA 


8940 


30 


TTTATTAGAC 


AATTTCAAAC 


TTTTTTTATT 


TTCATTCAAT 


TAACCTTTAA TTGAAAGCTA 


\ 9000 




. TTCTCAACTT 


TCCTTTTAAA 


TATGAAGCAA 


TTTTTTCAAA 


AACGCTATTA 


GTCACAAAAT 


9060 




GT 












9062 



(2) INFORMATION FOR SEQ ID NO: 86: 

- (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2738 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY; linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 86: 

AAATATTTTT TCAAAACTAT GTGAAAATGG aCCATGTCt A aATCATGTAA TAATG CAGyA 60 

CATAATGCCA - ACGGTCTmTC TTTATTGTCC CATGCATCAT GACCAATAAA TGACTCATCA 120 

ATTAATCGTC TAACTATTTC ATACACACCT AAAGAATGTC CAAAGCGACT ATGTTCTGCT ' 180 

GTGTGAAAAG ATAGGTACAG TGTTCCTAGT TGT CTAATTC GACGTAACCT TTGGAATTCC 240 
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10 



15 



20 



25 



30 



35 



40 



45 



50 



TCTTTAAAAA 


CTTTTTCTTC 


TACTAATTTT 


AAATCTACAT 


ATGCGTTAGT 


CATTATTCCC 


360 


CTCCTTTTCG 


TTTAATATAA 


TATTTAATTT 


ACTTAAAATG 


CTTTGTACAT 


AAGTGCTAAG 


420 


TCTAACTTTT 


CGCCATACAT 


TTCTGGCTCA 


TAAGAGCGTA 


AGATTGTAAA 


ACCTTGCTCT 


480 


TTATAGTAAG 


CTACTGCTTC 


TTCATTTTTA 


TTATCTACTT 


CTAAGTAAAC 


ACCTTCAAAT 


540 


TTATCTTCAA 


AACGTGATAA 


TCCTTCATTT 


AACAATGCTG 


TACCATAACC 


TGTATGTTGC 


600 


GATTCTGGTT 


TAACATAATG 


AGCTGATAAA 


TATAATTCTT 


CACCGTAAAT 


AAAGTTAGCA 


660 


AAGCCAACGA 


TGTCATTACC 


TTCTTGAACG 


ACTAAGAATA ATTGTTCTTG 


AAGTCTTTTC 


720 


TTTAAATGAT 


GTTCATTATA 


TGAAGCTtCT 


AACAAGTGAT 


TAACTGTTGT 


CGCAGCGTAT 


780 


ATATTTAAGT 


ATGTATTAAA 


CCAAGCTTTA 


GTTGCGACAT 


CTCTAATTTG 


AACAACATCT 


840 


TTTTCAGTTG 


CTTGTCTTAC 


CTTGAACATG 


ACTTTCTCCC 


CTTATTAACA 


AGTTTTAATA 


900 


ACGGCATTAT 


ACCACAACTT 


GCTCAATACT 


TAATAAACAA 


TGATTGTCTA 


TTCAATTTAT 


960 


ATATtTATAT 


TTTCCGTTAA 


AATTAAAAAT 


AAAAAATAAC 


GAAGGAAAAA 


AtCACTTCGT 


1020 


TTAGTATGAG 


G T ATGTC TT A 


TTGCAATATA 


CTATTCCACT 


CAGTTGCACG 


TGCTAAGGCA 


1080 


TAGTTGTCTT 


TCATGATGTC 


ACCAGGCTTT 


TCAGCAGTTC 


CAATAATATA 


ACCATTTAAA 


1140 


GTGGCACCTA 


r AAAG TCTAA 


ACTATATTTC 


ATTTGCGTAA 


TTGCTGGTTC 


GCTTTTATTT 


1200 


TTGGAGAATC 


TCCACCAACT 


AAAATAACTC 


TAAAATCCTT 


TTCGGCCATT 


TGTGCCTTAA 


1260 


AATTAGGATA 


TCGTTTATCT 


TGTAATGTTT 


CTGACCAATG 


TTCGATAAAT 


GCTTTCAATG 


1320 


GTGCTGAAAT 


G CT AT AC CAA 


TACACTGGTG 


ATGCAAAAAT 


AATTGTATCA 


CTAGCCAATA 


1380 


TTTTATCTAG 


AATCGGCAAA 


TAGTCATCGT 


CATATGAAGT 


AATAGTCTCT 


GCTGTATGTC 


1440 


TCACGTCACG 


TATCGGTTTA 


AACTGATGTT 


GTGTCACGTC 


AATCCATTGA 


TACTCTAAAT 


1500 


CTTGCAAAGC 


GAATTTTGTT 


AATTGTG CAG 


TATTACCGTT 


TGGTCTACTC 


CCACCAAACA 


1560 


AAACAGTAAT 


CATTTTAGCC 


TAAC CTCACT 


TTTGATTAAT 


AAATATCTGT 


GTTTTTCGTT 


1620 


ACCTAATTAT 


ACTATCATAA 


GCTTTGCCTA 


CCGAATAGTA 


AAACGCTTAC 


AACTTTTATA 


1680 


TAAATTTGAC 


GAAATTTCGT 


CATG CCTTAT 


ATAACGTCGT 


TTGTGATACG 


GGGCTAATTC 


1740 


ATGATGAAAT 


TAGATACATA 


TATCACCATT 


AAATACAATT 


CATTTAGTCT 


TCAATCGGAA 


1800 


ACAGTTCATC 


GATATATTGA 


AT CT CAT CAT 


CTGATAAAAC 


GATATCTGCA 


GCTTTAATAT 


1860 


TTTCAACGAC 


TTGTTCTGCA 


■CGTTTTGCAC 


CAGGAATAAT 


CACATCGATA 


GCTGGTCTCG 


1920 


TTAAATAAAA 


TGCTAATACA 


ATGTTCGCAA 


TTGAAGTTTG 


ATGTGCTGCA 


GCTATGCTTT 


1980 


CCAAAGCTTT 


TACGCGACGC 


ACATTTTCTT 


CAAATACACC 


TGGTTTAAAA 


TCACGACGTG 


2040 
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GCTAATGGGA AATATGGAAT AAATGTGATT TGGTGATCAA CACAATATTG TAATACTGCC 2160 

TCATTTTCGC GATGCAATAA ATTATATTCT AACTGTACAA CATCAACGTA AC CATCTTT A 2220 

5 TTTGCTTCTT TAAGTTGATC TAATGTGAAA TTTGATACAC CAATTGCTTT AATCTTCCCT 2280 

TGTTCCTTAA GCTCTTGTAA TGCTGCAACT GCTTGATCTT TGGGAGTGTT GTTATCCGGA 2340 

AAATGAATAT AATATAAATC GATATAATCA GTTTGTAGAC GTTTCAAACT ATTCTCAACT 2400 

10 

TGTTGTTTTA AATATTCCGG TTGATTGTTC TGATGTACTT CTTGATTTTC ATCAAATTCA 2460 

TGAGACCCTT TCGTAGCAAT TTTAATTTGC TCTCGCGGAT ATTCTTTAAC AACTTCTCCA 2520 

ACCAATTCTT CTGATCGTTC TGGCCCATAA ATATATGCCG TATCTAATAA ATTAATACCA 25B0 

15 

TGATTAATGG CTTGACGAAC AACATCTTTT CCTTGTTCTT CATCTAAGTT CGGATATAAA 264 0 

TTATGCCCAa CCTAtGCGTT CGTCCCAAGT GCGATTGGAA ACACTTCAAC ATCAGATTTA 2700 

20 CCTAAGTTTA CAAATTGCTn CATTAGACCC AGCnCCTT 273 8 

(2) INFORMATION FOR SEQ ID NO: 87: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9425 base pairs 
25 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 87: 

GATTAGATGA TATTTAACGA AAATTAaGrT GmAATACTtG AATGTArGAa GTCTGATGTC 60 

• GAAAATAGCT ATTAAAATAG AGTAGACGTA ATGt AAATGA AAGCACCTAA AATAGAAAAA 120 

35 

■ TTTCAAAAAT AGCGTAATTA TTATAATAAA T AGACTGCCA ATAAAATGCA * ATTTTTCACT — -180 

TATAACATTC TTCAAAAAAT AATAGCAAAA TTATGTAAAA AATATCTTGT CATGGCAAGA 240 

TTGGCTGTGC TATAATCTAT CTTGTGCTTA AGAACGGCTC CTTGGTCAAG CGGTTAAGAC 300 

40 

ACCGCCCTTT CACGGCGGTA ACACGGGTTC GAGTCCCGTA GGAGTCACCA TTTTTTAGGT 360 

CTCGTAGTGT AGCGGTTAAC ACGCCTGCCT GTCACGCAGG AGATCGCGGG TTCGATTCCC 420 

GTCGAGACCG TACAAATGCC TATCCAAGAG GATAGGCATT TTTTTGCGTT TAATATTATA 480 

45 

TTAATAAAAG ATATATGGAC GAATGATAAT CATATTGATT TATCTGTTCG TCCATTTTCT 54 0 

TTAAAATGTA TGAACCTCAA GTAACTTAGT GGTTGGATAT GAAAGATAAA CGTAGACAAT 600 

50 AAAATCTTTA TTAGACGTAC AAACATATGC TACTGTCAAC ATATTTCTTC GTTGTGATAT 660 
GCCACCAGTC CTCCATAACA TCAATTGTTA AAGTAACGAA TAACGAATAA TGATATTTAT - 72 0 
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GACCTCATCA TTGTGTTAAA TATCATTGTC ACAATCCGCC GTGAGAAACT AATAAAAAAT 840 

AGTAATATAT AAGTTTATAT TGGAAAATAG AATTAATAGC TTATAAATGG TAAATTATAT 900 

5 AATAGGTTAC TATACGTTAT AAGACGGAAA ATGCGCACAA TAACAAAAAT AGTAAGCGAC 960 

ATCCTGTGAT TTTTTACACA AACATAAACG ATAAAGAACA AAAAATGATA AAATAATATT 1020 

AATGATTTAA GAAAAGAGGT TTATGCAAAT GGCTAGAAAA GTTGTTGTAG TTGATGATGA 10 80 

10 

AAAACCGATT GCTGATATTT TAGAATTTAA CTTAAAAAAA GAAGGATACG ATGTGTACTG 114 0 

TGCATACGAT GGTAATGATG CAGTCGACTT AATTTATGAA GAAGAACCAG ACATCGTATT 1200 

ACTAGATATC ATGTTACCTG GTCGTGATGG TATGGAAGTA TGTCGTGAAG TGCGCAAAAA 1260 

15 

ATACGAAATG CCAATAATAA TGCTTACTGC TAAAGATTCA GAAATTGATA AAGTGCTTGG 1320 

TTTAGAACTA GGTGCAGATG ACTATGTAAC GAAACCGTTT AGTACGCGTG AATTAATCGC 13 80 

2Q ACGTGTGAAA GCGAACTTAC GTCGTCATTA CTCACAACCA GCACAAGACA CTGGAAATGT 144 0 

AACGAATGAA ATCACAATTA AAGATATTGT GATTTATCCA GACGCATATT CTATTAAAAA 1500 

ACGTGGOGAA GATATTGAAT TAACACATCG TGAATTTGAA TTGTTCCATT ATTTATCAAA 1560 

25 ACATATGGGA CAAGTAATGA CACGTGAACA TTTATTACAA ACAGTATGGG GCTATGATTA 1620 

CTTTGGCGAT GTACGTACGG TCGATGTAAC GATTCGTCGT TTACGTGAAA AGATTGAAGA 1680 

TGATCCGTCA CATCCTGAAT ATATTGTGAC GCGTAGAGGC GTTGGATATT TCCTCCAACA 1740 

30 ACATGAGTAG AGGTCGAAAC GAATGAAGTG GCTAAAACAA CTACAATCCC TTCATACTAA 18 00 

ATTTGTAATT GTTTATGTAT TACTGATTAT CATTGGTATG CAAATTATCG GGTTATATTT 1860 

TAGAAATAAC CTTGAAAAAG AGCTGCTTGA TAATTTTAAG AAGAATATTA CGCAGTACGC 1920 

55 GAAACAATTA GAAATTAGTA TTGAAAAAGT ATATGACGAA AAGGGCTCCG TAAATGCACA 1980 

AAAAGATATT CAAAATTTAT TAAGTGAGTA TGCCAACCGT CAAGAAATTG GAGAAATTCG 2040 

TTTTATAGAT AAAGACCAAA TTATTATTGC GACGACGAAG CAGTCTAACC GTAGTCTAAT 2100 

40 

CAATCAAAAA GCGAATGATA GTTCTGTCCA AAAAGCACTA TCACTAGGAC AATCAAACGA 2160 

TCATTTAATT TTAAAAGATT ATGGCGGTGG TAAGGACCGT GTCTGGGTAT ATAATATCCC 222 0 

AGTTAAAGTC GATAAAAAGG TAATTGGTAA TATTTATATC GAATCAAAAA TTAATGACGT 2280 

45 

TTATAACCAA TTAAATAATA TAAATCAAAT ATT CATTGTT GGTACAGCTA TTTCATTATT 234 0 

AATgCACAGT CATCCTAGGA TTCTTTATAG CGCGAACGAT TACCAAACCA ATCACCGATA 24 0 0 

SO TGCGTAACCA GACGGTCGAA ATGTCCaGAG GTAACTATAC GCAACGTGTG AAGATTTATG 24 60 

GTAATGATGA AATTGGCGAA TTAGCTTTAG CATTTAATAA CTTGTCTAAA CGTGTACAAG 2520 
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GTGATGGTAT TATTGCAACA GACCGCCGTG GACGTATTCG TATCGTCAAT GATATGGCAC 2640 

TCAAGATGCT TGGTATGGCG AAAGAAGACA TCATCGGATA TTACATGTTA AGTGTATTAA 2700 

5 GTCTTGAAGA TGAATTTAAA CTGGAAGAAA TTCAAGAGAA TAATGATAGT TTCTTATTAG 2760 

ATTTAAATGA AGAAGAAGGT CTAATCGCAC GTGTTAACTT TAGTACGATT GTGCAGGAAA 2820 

CAGGATTTGT AACTGGTTAT ATCGCTGTGT TACATGACGT AACTGAACAA CAACAAGTTG 2880 

10 

AACGTGAGCG TCGTGAATTT GTTGCCAATG TATCACATGA GTTACGTACA' CCTTTAACTT 2940 

CTATGAATAG TTAGATTGAA GCACTTGAAG AAGGTGCATG GAAAGATGAG GAACTTGCGC 30O0 

T5 CACAATTTTT ATCTGTTACC CGTGAAGAAA CAGAACGAAT GATTCGACTG GtCAATGACT 3060 

TGCTACAGTT ATCTAAAATG GATAATGAGT CTGATCAAAT CAACAAAGAA ATTATCGACT 3120 

TTAACATGTT CATTAATAAA ATTATTAATC GACATGAAAT GTCTGCGAAA GATACAACAT 3180 

20 TTATTCGAGA TATTCCGAAA AAGACGATTT TCACAGAATT TGATCCTGAT AAAATGACGC 3240 

AAGTATTTGA TAATGTCATT ACAAATGCGA TGAAATATTC TAGAGGCGAT AAACGTGTCG 3300 

AGTTCCACGT GAAACAAAAT CCACTTTATA ATCGAATGAC GATTCGTATT AAAGATAATG 3360 

25 GCATTGGTAT TCCTATCAAT AAAGTCGATA AGATATTCGA CCGATTCTAT CGTGTAGATA 3420 

AGGCACGTAC GCGTAAAATG GGTGGTACTG G ATT AGG AC T AGCCATTTCG AAAGAGATTG 3480 

TGGAAG CG CA ' CAATGGTCGT ATTTGGG CAA ACAGTGTAGA AGGTCAAGGT * ACATCTATCT 3540 

TTATCACACT TCCATGTGAA GTCATTGAAG ACGGTG ATTG GGATGAATAA ' TAAGGAG CAT 3600 

ATTAAATCTG TCATTTTAGC ACTACTCGTC TTGATGAGTG TCGTATTGAC ATATATGGTA 3660 

TGGAACTTT T CTCCTGATAT TGCAAATGTC GACAATACAG ATAGTAAGAA GAGTGAAACG 3720 

35 

rAACCTTTAA CGACACCTAT GACAGCCAAA ATGGATACAA CTATTACGCC ATTTCAGATT 3780 

ATTCATTCGA AAAATGATCA TCCAGAAGGA ACGATTGCGA CGGTATCTAA TGTGAATAAA 3840 

CTGACGAAAC CTTTGAAAAA TAAAGAAGTG AAGTCCGTGG AACATGTTCG TCGTGATCAT 3900 

40 

AACTTGATGA TTCCTGATTT GAACAGTGAT TTTATATTAT TCGATTTTAC GTATGATTTA 3960 

CCGTTATCAA CAT AT CTTGG TCAAGTACTG AACATGAATG CGAAAGTACC AAATCATTTC 4020 

45 AATTTCAATC GTTTGGTCAT AGATCATGAT GCTGATGATA ATATCGTGCT TTATGCTATA 4080 

AGCAAAGATC GCCACGATTA CGTAAAATTA ACAACTACAA CGAAAAATGA T CATTTTTT A 4140 

GATGCATTAG CAGCAGTGAA AAAAGATATG CAACCATACA CAGATATCAT CACAAACAAA 42 00 

50 GATACAATTG ATCGTACGAC GCATGTTTTT GCACCAAGTA AACCTGAAAA GTTAAAAACA 4260 

TATCGCATGG TATTTAACAC GATTAGTGTT GAGAAAATGA ATGCTATACT ATTTGACGAT 4320 
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GCAAACTATA ACGATAAAAA TGAAAAATAT CATTATAAAA ACCTGTCCGA AGATGAAGCG 4440 

AGTTCCAGCA AAATGGAAGA AACGATTCCA GGAACCTTTG ATTTTATTAA TGGTCATGGT 4500 

5 GGTTTCTTAA ACGAAGACTT TAGATTGTTT AGTACGAATA ATCAGTCAGG CGAGTTAACA 4560 

TATCaACGTT TCCtTAATGG TTATCCAACG TTTAATAAAG AAGGTTCTAA TCAAATTCAA 4620 

GTCACTTGGG GTGAAAAAGG CGTCTTTGAC TATCGTCGTT CGTTATTACG CACCGACGTT 4680 

10 

GTTTTAAATA GTGAGGATAA TAAATCGTTG CCGAAATTAG AGTCTGTACG TTCAAGCTTA 474 0 

GCGAACAATA GTGATATTAA TTTTGAAAAA GTAACAAACA TCGCTATCGG TTACGAAATG 4800 

CAGGATAATT CAGATCATAA TCACATTGAA GTGCAGATTA ACAGTGAACT GGTACGGCGT 4860 

75 

TGGTATGTAG AATATGATGG CGAATGGTAT GTTTATAACG ATGGGaGGCT TGaATAAATG 4920 

AACTGGaAAC TGACAAAGAC ACTTTTCATT TTCGTGTTTA TTCTTGTCAA CATCGTGTTA 4980 

20 GTATCGATTT ATGTTAATAA AGTCAATCGC TCACACATTA ATGAAGTCGA GAGTAACAAT 504 0 

GAAGTTAATT TTCAGCAAGA AGAAATTAAA GTACCGAGTA GTATATTGAA TAAATCAGTT 5100 

AAAGGTATAA AATTAGAGCA AATTACAGGG CGATCAAAAG ACTTTAGTTC TAAAGCTAAA 5160 

25 GGCGATTCGG ATTTGACCAC ATCAGATGGT GGAAAATTAT TGAATGCGAA CATTAGTCAA . 522 0 

TCGGTAAAGG TCAGTGACAA TAACTTAAAA GATTTGAAAG ATTATGTTAA CAAGCGCGTA 528 0 

TTTAAAGGTG CTGAATATCA ATTAAGCGAG ATTAGTTCAG ATTCTGTAAA ATATGAACAA 534 0 

30 ACGTATGATG ATTTTCCGAT TTTAAATAAC AGTAAAGCGA TGTTAAACTT TAATATAGAA 54 0 0 

GATAACAAAG CGACTAGTTA TAAACAATCA ATGATGGATG ACATTAAGCC CACAGATGGT 5460 

GCAGATAAGA AGCATCAAGT GATTGGTGTG AGAAAAGCAA TCGAGGCATT ATATTATAAT 552 0 

35 

CGTTACTTGA AAAAAGGTGA TGAAGTCATT AATGCTAGAC TCGGTTACTA CTCAGTCGTG 5580 

AATGAAACGA ATGTTCAATT GTTACAACCA AACTGGGAAA TTAAAGTGAA GCATGACGGT 564 0 

AAGGATAAAA CGAATACTTA CTATGTCGAA GCGACAAATA ATAACCCTAA AATTATTAAT 570 0 

40 

CATTAATATG AATCGTAATA AGCTAGCATT GCAAGCTCAT CATATGTGAG AAGCX3GTGCT 5760 

AGCTTTTTTG CTGGTACGGT TTATTATGGC TGATGTTTTT GCGTGTCGAA CGTGCGCATT 5820 

TATTCATATT TTAAGTAGAA CCGCATTGTA AAATTAGTGT AACTGTTATT TTAAAAACTT 588 0 

45 

TAGTATTTGT CTAATCATTG TTATAATAAT TAAGAAATTC ATTGCACGTG ATTATCAAAA 594 0 

TTTAAATATA AGAAACCGGT CGATGAACTA AAGTTACATA ATAGGAAAGG TATACAAAAC 6000 

50 AGCTAATATA CTGATAGTTT CTGTAGGGAA AATCGTATAT TTGCACTGAT GTATATTGCA 6060 

GTCATATAGA GAGATTGACT GTTTAAAGAG AAAGGATGAG GCGCTTGATA CGCATGAGTG 6120 
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TAGTTGATGT 


TGGTTTGACT 


GGAAAGAAAA 


TGGAAGAATT 


GTTTAGTCAA ATTGACCGTA 


6240 




ATATTCAAGA TTTAAATGGT ATTTTAGTAA CCCATGAACA TATTGATCAT ATTAAAGGAT , 


6300 


5 


TAGGTGTTTT 


GGCGCGTAAA 


TATCAATTGC 


CAATTTATGC 


GAATGAAAAA 


ACTTGGCAGG 


6360 




CAATTGAAAA 


GAAAGATAGT 


CGCATCCCTA 


TGGATCAGAA 


ATTCATTTTT 


AATCCTTATG 


6420 




AAACAAAATC 


TATTGCAGGT 


TTCGATGTTG 


AATCGTTTAA 


CGTGTCACAT 


GATGCAATAG 


6480 


10 


ATCCGCAATT 


TTATATTTTC 


CATAATAACT 


ATAAGAAGTT 


TACGATTTTA 


ACGGATACGG 


6540 




GTTACGTGTC 


TGATCGTATG 


AAAGGTATGA 


TACGTGGCAG 


CGATGCGTTT 


ATTTTTGAGA 


6600 


15 


GTAATCATGA 


CGTCGATATG 


TTGAGAATGT 


GTCGTTATCC 


ATGGAAGACG 


AAACAACGTA 


6660 


TTTTAGGCGA 


TATGGGTCAT 


GTATCTAATG 


AGGATGCGGC 


TCATGCAATG 


ACAGACGTGA 


6720 




TTACAGGTAA 


CACGAAACGT 


ATTTACCTAT 


CGCATTTATC 


ACAAGACAAT 


AACATGAAAG 


6780 


20 " 


.. ATTTGGCGCG 


TATGAGTGTT 


GGCCAAGTAT 


TGAACGAACA 


CGATATTGAT 


ACGGAAAAAG 


6840 




AAGTATTGCT 


ATGTGATACG 


GATAAAGCTA 


TTCCAACGCC 


AATATATACA 


ATATAAATGA 


6900 


\ 


GAGTCATCCG 


ATAAAGTTCC 


GCATTGCTGT 


GAGACGACTT 


TATCGGGTGC 


TTTTTTATGT 


6960 


25 


TGTTGGTGGG 


AAATGGCTGT 


TGTTGAGTTG 


AATCGGCTTG 


ATTGAAATGT 


GTAAAATAAT 


7020 




TCGATATTAA 


ATGTAATTTA 


TAAATAATTT 


ACATAAAATC 


AATCATTTTA 


ATATAAGGAT 


7080 




TATGATAAT A 


. TATTGGTGTA 


TGACAGTTAA 


TGGAGGGAAC 


GAAATGAAAG 


CTTTATTACT 


7140 


30 


TAAAACAAGT 


GTATGGCTCG 


TTTTGCTTTT 


TAGTGTAATG 


GGATTATGGC 


AAGTCTCGAA . 


. .7200 




CGCGGCTGAG 


CAGCATACAC 


CAATGAAAGC 


ACATGCAGTA 


ACAACGATAG 


ACAAAGCAAC 


7260 




AACAGAT AAG 


CAACAAGTAC 


CGCCAACAAA 


GGAAGCGGCT 


CATCATTCTG 


GCAAAGAAGC 


7320 


35 


GGCAACCAAC 


GTATCAGCAT. 


CAGCGCAGGG 


AACAGCTGAT. 


. GATACAAACA 


GCAAAGTAAC 


73 80 




ATCGAACGCA ccatctaaca aaccatctac agtagtttca acaaaagtaa acgaaacacg 


7440 


40 


CGACGTAGAT 


ACACAACAAG 


CCTCAACACA 


AAAACCAACT 


CACACAGCAA 


CGTTCAAATT 


7500 


ATCAAATGCT 


AAAACAGCAT 


CACTTTCACC 


ACGAATGTTT 


GCTGCTAATG 


CACCACAAAC 


7560 




AACAACACAT 


AAAATATTAC 


ATACAAATGA 


TATCCATGGC 


CGACTAGCCG 


AAGAAAAAGG 


7620 


45 


GCGTGTCATC 


GGTATGGCTA 


AATTAAAAAC 


AGTAAAAGAA 


CAAGAAAAGC 


CTGATTTAAT - 


7680 




GTTAGACGCA 


GGAGACGCCT 


TCCAAGGTTT 


ACCACTTTCA 


AACCAGTCTA 


AAGGTGAAGA 


7740 




AATGGCTAAA 


GCAATGAATG 


CAGTAGGTTA 


TGATGCTATG 


GCAGTCGGTA 


ACCATGAATT 


7800 


50 


TGACTTTGGA 


TACGATCAGT 


TGAAAAAGTT 


AGAGGGTATG 


TTAGACTTCC 


CGATGCTAAG 


7860 




TACTAACGTT 


TATAAAGATG 


GAAAACGCGC 


GTTTAAGCCT 


TCAACGATTG 


TAACAAAAAA 


7920 
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TGAAGGCATT AAAGGCGTTG AATTTAGAGA TCCATTACAA AGTGTGACAG CGGAAATGAT 804 0 

GCGTATTTAT AAAGACGTAG ATACATTTGT TGTTATATCA CATTTAGGAA TTGATCCTTC 8100 

5 AACACAAGAA ACATGGCGTG GTGATTACTT AGTGAAACAA TTAAGTCAAA ATCCACAATT 8160 

GAAGAAACGT ATTACAGTTA TTGATGGTCA TTCACATACA GTACTTCAAA ATGGTCAAAT 8220 

TTATAACAAT GATG CATTGG CACAAACAGG TACAGCACTT GCGAATATCG GTAAGATTAC 8280 

10 

ATTTAATTAT CGCAATGGAG AGGTATCGAA TATTAAACCG TCATTGATTA ATGTTAAAGA 8340 

CGTTGAAAAT GTAACACCGA ACAAAGCATT AGCTGAACAA ATTAATCAAG CTGATCAAAC 8400 

1S ATTTAGAGCA CAAACTGCAG AGGTAATTAT TCCAAACAAT ACCATTGATT TCAAAGGAGA 8460 

AAGAGATGAC GTTAGAACGC GTGAAACAAA TTTAGGAAAC GCGATTGCAG ATGCTATGGA 8520 

AGCGTATGGC GTTAAGAATT TCTCTAAAAA GACTGACTTT GCCGTGACAA ATGGTGGAGG 8580 

20 TATTCGTGCC TCTATCGCAA AAGGTAAGGT GACACGCTAT GATTTAATCT CAGTATTACC 864 0 

ATTTGGAAAT ACGATTGCGC AAATTGATGT AAAAGGTTCA GACGTCTGGA CGGCTTTCGA 8700 

ACATAGTTTA GGCGCACCAA CAACACAAAA GGACGGTAAG ACAGTGTTAA CAGCGAATGG 8760 

25 CGGTTTACTA CATATCTCTG ATTCAATCCG TGTTTACTAT GATATAAATA AACCGTCTGG 8820 

CAAACGAATT AATGCTATTC AAATTTTAAA TAAAGAGACA GGTAAGTTTG AAAATATTGA 88 80 

TTTAAAACGT GTATATCACG TAACG ATGAA TGACTTCACA GCATCAGGTG GCGACGGATA 894 0 

30 

TAGTATGTTC GGTGGTC CTA GAGAAGAAGG TATTTCATTA GATCAAGTAC TAG CAAGTT A 9000 

TTTAAAAAGA GCTAACTTAG CTAAGTATGA TACGACAGAA CCACAACGTA TGTTATTAGG 9060 

TAAACCAGCA GTAAGTGAAC AACCAGCTAA AGGACAACAA GGTAGCAAAG GTAGTAAGTC 9120 

35 . 

TGGTAAAGAT ACACAACCAA TTGGTGACGA CAAAGTGATG GATCCAGCGA AAAAACCAGC 9180 

TCCMGTAAA GTTGTATTGT TgtAGCGCAT AGAGGAACTG TTAGTAGCGG TACAGAAGGT 9240 

TCTGGTCGCA CAATAGAAGG AGCTACTGTA TCAAGCAAGA GTGGGAAACA ATTGGCTAGA 93 00 

40 

ATGTCAGTGC CTAAAGGTAG CGCGCATGAG AAACAGTTAT TTCATAATCA ACAGTCATTG 9360 

ACGTAGCTAA GTAATGATAA ATAATCATAA ATAAAATTAC AGATATTGAG AAAAAATAGT 9420 

45 AAATA 9425 

(2) INFORMATION FOR SEQ ID NO: 88: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3886 base pairs 
so (B) TYPE: nucleic acid 

(C) STRAND EDN ESS : double 

(D) TOPOLOGY: linear 
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<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 88: . . .. 

AGTTGTAATG TCACATTTCC AGAGTCTGAA ATTATCTTTA TCACGTTACA TTTACTAGGC 60 

TCTAAAATGA CTGAACATAC AGCATCTTCA ATTACCTTTG AATACCATGA TTTATCGCAA 120 

AATATACATG AATTGATCAC TTGTGTTAGC . CAAGAATTAG GCATTGATAT GTCAAAAGAC 180 

AACAAGTTAC ATACCAGTCT GATCACACAT ATCAAACCAG CTATACATCG TATTAAATAC 240 

GATATGCTAC AACCTAATCC TTTGAGGCAA GAAGTTATGC GTCGCTATCC TCAAATCATT 300 

GAAGCCGTTA GCAAGCATAT TAGTCCAATT GAACAAGATG CTGCTATTCG CTTCAACGAA 360 

GATGAATTAA CATACATTAC AATTCACTTC GCATCAAGTA TAGAGCGTGT TGCAACACAT 420 

AAACAATCAA TGATTAAGGT TGTCTTACTA TGTGGTTCTG GTATAGGCAC GTCACAACTT 4 80 

TTAAAATCAA AACTAAATCA CCTGTATCCT GaGTTnCACA TTTGGGAtGc CTATTc CATT 540 

TaTcAATTGG aAGaAAGTCG ATTATTGCAA GATAACATTG ATTATGTCAT TTCAACAGTA 600 

20 ' 

CCTTGTGAAA TATCAGCTGT ACCAGTTATT CATGTCGATC CATTTATCAA TCAACAATCT 660 

CGTCAAAAAT TGAATCAAAT TATCAATGAC TCAAGAGAAC AACGAGTCAT GAAAATGGCA 720 

2s . ACTGATGGCA AGTCACTCGC AGATTTATTG CCTGAACATC G CAT CATTAT AAATAAACAA 780 

CCATTATCAA TTGAATCCGC AATTGCAGTG GCTGTGCAAC CTTTAATCAA TGATGGCATT 840 

GTCTATTCAA ATTATACAGC TGCAATTTTA AAACAATTTG AACAATTCGG GTCATATATG 900 

30 GTCATTAGTC CACATATTGC ACTTATTCAC GCTGGTACTG.. ATTATGTACA GAATGGTGTA 96 0 
GGTTTCGCAC TAACATATTT CACTGAAGGG ATTATCTTTG GTAGTAAAGC TAACGATCCC . 1020 

GTTCACCTTG TAATTACATT AGCAACGGAC CACCCCAATG CACATTTAAA GGCATTGGGA 1080 

35 CAGTTAAGCG AATGCTTAAG CAACGACTTA TATCGACAAG ATTTCTTAGA TGGGAATATT 114 0 

TTTJ^AATTA AACAACACAT TGCTTTAACT ATGACAAAGG AGGCTTAATA ACGTGTCATT 1200 

AGACATTTTG TCAACAACAC GCATCATTGT AAAAGAACAA GTAAATGATT GGACTGAAGC 1260 

TATAACTATA GCTTCTCAGC CATTACTACA AGAACAAATT ATTGAACAAG GCTATGTTCA 1320 

AGCAATGATT GATAGCGTTA ATGAACTTGG ACCTTATATC GTTATCGCAC CTGAAATTGC 13 80 

AATTGCACAT GCAAGACCGA ACAATGACGT ACATCAAGTT GGTTTAAGTC TATTAAAGTT 144 0 

GAATCAACAT GTGGCATTTT GTGATGAAGA TCACTACGCA TCTCTCATTT TTGTATTGAG 1500 

TGCCATCGAC AATCATTCAC ACTTATCTGT ATTACAAAAT TTAGCAACCG TACTGGGCGA 1560 

so TAACCAAACA GTCCAGCAAC TATTAACTGC AACAAATGCA CAAGACATTA AAAACATTTT 1620 

AAAGG AG CAT GATTAATATG AAAATTTTAG TAGTATGTGG CCACGGTTTA GGAAGTAGTT 1680 
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AAGTTGAACA TAGTGACATT ATGACAGCAA GTCCAGAGAT GGCTGACTTG TTTATTTGTG 1800 

GTAGAGATTT AGCTGAAAAT GCCGAACGTC TAGGGGATGT CTTAQTTCTT GATAATATTT 1860 

5 

TAGATAAAGC TGAATTACAA CAAAAGGTCT GAGAAAAATT ACAACAACTT AACATGATTT. 1920 

AAAGGAGGTA CGACCTATGC AAGCAATCCT TAATTTTATA GTCGATATTT TAAGTCAACC 1980 

AGCCATTCTT GTTGCACTGA TTGCCTTTAT AGGTTTAATC GTTCAGAAAA AACCTGCCGC 2040 

10 

AACGATCACT TCAGGAACCA TTAAAACGAT ATTAGGCTTC TTAATTTTAA GTGCAGGTGC 2100 

TGATGTCGTC GTTCGATCTC TTGAACCATT CGGCAAAATA TTCCAACACG CATTTGGTGT 2160 

1S GCAAGGTATC GTACCTAACA ACGAAGCTAT CGTCTCACTA GCCTTAAAAG ATTTTGGAAC 2220 

AACAGCTGCA CTCATCATGG TCTGTGGCAT GATTGTTAAT ATTTTAATTG CCCGCTTCAC 2280 

TAATTTAAAA TATATCTTTT TAACAGGTCA TCATACATTT TACATGGCTG CGTTTTTAGC 2340 

20 AATCATTTTA ACAGTCAGTC ATATTAAAGG CTGGCTAACG ATTGTTATCG GCGCACTCGT 24 00 

ATTAGGATTA ATCATGGCAG TATTACCTGC ATTACTCCAA CCTACGATGC GAAAAATTAC 24 60 

AGGGAATGAC CAAGTAGCTT TAGGTCATTT TGGCTCAATC AGTTACTTTG CCGCAGTGCT 252 0 

26 GTAGGTCAAT TATTCAAAGG TAAGTCTAAA TCAACGGAAG AGATTAAATT TCCAAAAGGC 2580 

TTAAGTTTCT TACGAGAAAG TACAATTAGT ATCTCGATTA CGATGGCATT ACTTTACTTC 2640 

ATCGCATGCT TATTTGCGGG CGTTAGTTAT GTACACGAAT CTATTAGTGA TGGTCAAAAC 2700 

30 ; ' 

TTTATTGTCT TTTCATTAAT TCAAGGTGTG ACATTTGCTG CTGGTGTATT TATTATTTTA 2760 

ACGGGCGTTC GTTTAATCTT AGCTGAAATC GTCC CAGGAT TTAAAGGAAT TTCTGAAAAG 2820 

CTTGTACCAA ATTCTAAACC TGCATTAGAC TGCCCTATTG TGTTCCCTTA TGCACAAAAT 28 80 

35 

GCAGTATTAA TTGGATTCTT TGTCAGCTTT ATTACAGGTG TCATCGGTAT GTTTATCTTA 2940 

TTCTTATTTG GTGGCGTCGT CATTTTACCT GGCGTAGTTG CACACTTCTT CTTAGGTGCA 3000 

ACGGCTGCTG TATTCGGTAA TGCAAGAGGC GGTATTAAAG GTGCTATTGc TGGCGCCGCT 3060 

40 

CTAAATGGTA TCCTAATCAC GTTTTTACCA TTATTATTCT TGCCATTTTT AGGCGAATTA 3120 

GGTGGTGCTG CAACAACATT CTCAGATACA GACTTTTTAG CTGTCGGTAT CGTGTTCGGT 3180 

4S AACGCAGTAA AATATATGGG ATTATTTGGT GCGATTCTAT TTATTATTAT CGTAGGTGCG 3240 

ACAACAATTT TATTAAAAGG CCGTCAAAAA GAACAGCAAT AGTGTTAACG TAGAAATATA 3300 

AAACACCGTC ACATATTGAG TGAATGCCCC TTT C ATCAAG AGGAAAGCCA CTTACTTATG 33 60 

50 GACGGTGTTT TGTATTATAT TAAATGATAC TTAGCCATAC TATCGACAGC TGCTAAAATT 34 20 

GCTTCTTCTT GTGTCGGAAT CGGTTCCCAA CCAAGTAATG TTTTTgCAGG TTCGTTACTT 34 80 
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CCTAGACTCA AAATAAAGTC TGGTAATTTT TTAGTAGAAA CTTTTTGAGC TATTTCAGGT 3 €00 

CTCTTTTCTT TAATTAATTT TGCAATTTCC AACAAATTAA TTTGTCCATC AGCCGTCGCA 3660 

5 ATAAATCGCT TGCCATTAGC TTGTTCATTT GTCATTGCCA AAATGTGCAG TTCAGCTACG 3720 

TCTCTCACAT CAACAACATT TAACGGAATT TGCGGTACAC GTTTCATTGA ACCATTCAAT 3 7 BO 

AAATTTTCTA ATAAATGAAA GCTTCCTGAA ACGTGTGCAT CTAATGATGG CCCAAAAATT 3840 

io 

GCAACTGGAT TGATTGTGGC AAATTCTACT GTTGTATTTT CATTCT 3 8B6 

(2) INFORMATION FOR SEQ ID NO: 89: \ 

(i) SEQUENCE CHARACTERISTICS: 
15 , (A) LENGTH: 4879 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 89: 





-GTCATCTATC 


AAAAATTTGG 


TATACAGACC 


GACAATTATT 


AATTAATAAT 


TTAATTTCCC 


60 


25 


AGGCAATACC 


AGTGATTAAA 


TATCCACAAA 


TACAACATAA 


AGAACAACCA 


TTAGAATCTA 


120 




TTTCACAACT 


TATATTGTCT 


AAGATGACAT 


CTAATCAATA 


GTGTTTAAAT 


TTCTCAGTGG 


180 




CTGTGAATGA 


GGTTTAAAAG 


TACTATAAAA 


CGTAAACTTT 


GATACTTTAA 


AATACGGAAA 


240 


30 


AAACGGTAAA 


CCCTAATTCA 


TATTATAGAG 


TTTACCGTTT- 


TATTTTTTAA 


CTTGCATCAT 


300 




AGTTATATTA 


ACATTATTGT 


TGGTAGTTTG 


GATCAGTAAC 


CATTGCTTGT 


CCAGTATAAT 


360 




CAACCGTTAC 


AATTGAATAT 


TTTCCaTTTG 


CATTTGGGTC 


TTTAAAACTA 


AACACATACT 


420 


35 


TATAGTTGCC 


ATTATGTTCT 


TCAATAGAAT 


AATCATTATA 


CACTTTATTA TTACTACCAA , 


480 




AT'ITATTTGC 


TTCATTATTA 


GCCGCATTTA 


AAGCTGTTTG 


GAAATTTGGC 


AATTGCTGTA 


540 


40 


AAGCTTGATT 


TTTATTTCCA 


TTAAACGGAT 


AAATTTGACG 


TGCAACCGGC 


GCGGCATTTT 


600 


GnCCATAATA 


TGGTGCAACG 


TAACTTGATT 


TTTGATTATT 


ATTCGCTTGG 


TTATTACTTG 


660 




ATTGGTTATT 


ATTTGTTTGG 


TTTTGGTCAT 


TGTTTGTTGC 


ATTTGAATTA 


GATTGTTGCT 


720 


45 


GGTTATCGTT 


TGCACTATTA 


TCTTTATTAT 


CTTTGTTTAC 


GTCTTTACTA 


TCATCTTTAT 


780 




TATCTTTCTT 


ATCTTTAGAT 


GAATCATTTG 


TTTTTTTATC 


TTGTTGTTCA 


GTTTTCGCTT 


840 




TAT CATCTTT 


TTCTTTATTA 


CCGTCTTTTT 


GTTGGTCACT 


ATCTTGACCA 


CATGCAGCTA 


900 


50 


AAAATAATGA 


TAATGCTAGT 


AACCCTGTAA 


CTAATCTTTT 


CATACATATC 


TCCTCCTATA 


960 




ATTCGATATT 


CATTGAATAA 


TCTTGAAATA 


CATATCTACC 


ATGTGTATCT 


TTTCATGGCT 


1020 
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TAAGGTTCTT TTTATTATAC CCTAATTTTT GTTCATTATT ATTTAATTTT TGTGAATTTT 114 0 

ATGtTTkCTA TAAATTTAAT TATTTTACTT TAACAATTCA TTACGGATTT AGCATTTCAA 1200 

GGTATACACA ATATTTATTA CTATGATTTC ATTTTATCTG CTGCAAAAAC AATCATTATA 1260 

ACTCTTTTTC CATAATTAAA TCTGTATCCG TTACATCACC TGTTTGAAAA TGATGTTCAC 13 20 

CAACCACTTT AAATCCATGA CGTTTATAAA ATGCTTGAGC ACGAGGATTA TGCTCCCAAA 13 80 

CTCCTAGCCA AATTTTATGT TTATTATGTT CTTGAGCAAT TTTTTCGGCC AATTCTATCA 1440 

ATTGTGAACC TCTTCCGCCA CCTTGAAAGT CTCTCAAAAA ATATATGCGC TGCACTTCTA 1500 

AATAGGTCTC CCCCATTTCT TCAGTTTGAG CACTATTAAT ATTCATCTTT ATATAACCAA 1560 

CATTCGCACC ATCTTCTTGa TAAAAATAAT GAAATGAATC TACATGGTTA ATCTCTTGTG 1620 

TAAATTTCTC TACAGTATAA TTGTCTTTAA AAAATTGATC AAAATCTTTG TCATCATAGT 1680 

20 AAGAACCAAA CGTGTCATAA AATGTTCTAG TTGCTAATTC AACTAATTCA CTAGCATTTT 1740 

GTTCTGAAAT TTCTTTGATT ATCCCAGCCA TATAAATCCT CCAATAAACA GTGATCGAAT 1800 

CAAAATATTA CTTATGTTAT TTTTCAGCCA AAACTATTTA AAAATACATT AACACAAATC 1860 

25 AATTACAAAT TGTATTGATT GTGTGTAACA TCAATAAATG ATACATTTAT TCCAGTAAAA 1920 

TGGCCGTATT TTCAAAAGAG AAAAAGAGAG GATGTATCGT TGTGATAGAA ACATTTAAAG 1980 

CGTTTG T AAT TGATAAAGAT GAGAGTGGTA AAGTGACACC AACTTTCAAA CAATTATCGC 204 0 

CTACTGATTT ACCTAAAGGA GATGTGCTGA TTAAAGTACA TTACTCTGGT ATAAATTATA 2100 

AAGATGCTTT AGGGACTCAA GATCATAATG CAGTCGTAAA ATCGTATCCT ATGATTCCAG 2160 

GAATAGATTT AGCTGGAACA ATTGTTGAAT CCGAAGCACC AGGCTTTGAa AAAGGAGAAC 2220 

AAGTAATTGT AACGAGTTAT GACCTAGGTG TCAGCGATTA TGGCGGTTTT AGTGAATATG 22 80 

CGCGTGTAAA ATCAGAATGG ATT AT CAAG C TTCCTGATAC TTTAACATTA GAAGAATCAA 234 0 

TGATATATGG CACAG CTGGT TATACTGCCG GTTTAGCAAT TGAAAGACTT GAAAAAGTTG 24 00 

GAATGAATAT TGAAGATGGT CCTGTACTCG TTCGCGGTGC TTCAGGTGGT GTCGGTACTT 24 60 

TAGCAGTACT CATGCTTAAT GAACTTGGTT ATAAAGTTAT CGCAAGTACA GGTAAACAAG 2520 

ATGTTAGCGA TCAATTACTT GAACTTGGTG CCAAAGAAGT TATCGATCGA CTTCCTGTTG 2580 

AAGATGATCA TAAAAAGCGA CTCGCATCAT CAACTTGGCA AGCTTGTGTA GACCCTGTTG 264 0 

GTGGCGAAGG TATTAATTAT GTTACAAAGC GTTTAAATCA TAGTGGGTCA ATTACAGTTA 2700 

TTG GTATGAC TGCCGGTAAT ACTTATACTA ATTCTGTATT CCCTCACATT TTAAGAGGTG 2760 

TAAACATTTT AGGAATTGAC TCGGTATTTA CTGCTATGAA ATTAAGACAG CGCGTTTGGC 2820 
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TTGATGAACT TCCAGAACAA CTTAACAAAG TAATTAAACA TGAAAATAAA GGGCGCATTG 2940^ 

TTATCGATTT CGGTGTAGAT AAATAGTATT CATGAAAAAG ACATCCCGTT ATGCGAGATG , 3000 

TCTTTTTTAA TTTAGTATTT GATATACATA CCGCCTGAAT CTGGTTCGGT AGGTATAAAT 3060 t 

CCAAATTTTG TATATAATTT ATCCGCTGGG TAGTCTGCAA TCAGAcTAAC GTATGTACTC 3120 

TCAACAGCCA CACCTTTAAT ATATTGCATA ATATGCTCCA TAATTAGACT GCCGTAACCT 3180 

TGACCTTGGT AACTTTTCAA AACTGCAATA TCAACAATTT GAAAAACAGT TCCGCCATCG 3240 

CCAATCACTC TACCCATACC AATTAACCGA TCTTTATCAT AGAAGGTTAC TGTAAATAAG 3300 

GCATTAGGTA ATCCTTTTTC aGCTGTTCGC GCGTCTTTGG ACTCATACCT GCGTTAATCC 3360 

TTAATGCGCA ATAATCCTCG CAAGTCGGAA TATCATATGT CACTTTAACC ATTATTTACC 3420 

CCACTTTTCA TCACACAATA TATCAACCTA GTATAAATGT TTATTTACAA TAGTCTTATT 3480 

CGCTTCTTTA AACACTTCAT GATGACTTGA AACATAACCC TCTGCATTCG CATCTGGTTG 3540 

" GATATATGTT TTAGCAAGGT TCGCTGCATT TGCACCATCA CTAAATGCAC TTGCAATTAG 3600 

ATGTGATTTT GCATCATGAT AAACAATATC TCCACACGCA TAGATACCAG GTATACTAGT 3660 

25 TGTCGTATTA CCAAATCCTT TAACACGACA ATCATCATGC AT AT CT AG CT TTGAAGATGT 3720 

TtCACTCAAT AATGTATTAC AACGATCAAA CCCATGACTA ATAATGACAT CGTCAAATTT 3780 
AACTGTATGC CTATCGCCAC TTTCAACATG TTCCAAAACA ACTTCACTTA TATGCGTTTC ., 3 840 
30 ATCATCATTG CCGACCAAGT ATTTAATACG TGTTTTTGGG CATAGTTTCA CATTTAAATC. ".. 3 900 

TGTCACCAAC GTTTTCATCG CTTCATGACC ACTTACATCT TCTTTTCGAT AAACAACTGT 3 960 

CACGCTTTTA GCAATCTTGG CAATATCATG CGCCCAATCT AATGCTGTAT TTCCTCCACC 4020 

55 TGATATTAAT ACATCTTTAT CTTTGAAACG TCTGTAACTT TGTACAACAT AATGTAAATT . 4080 

. AGTT5ATTGA TATCTCTCTA CACCTTTAAC ATCTAATTGT TTTGGATTAA TAATAGCCGC 4140 

ACCAATTGCA ATGATAACTG CTTTCGATGT ATATATTTCT CCCGCTTCTG TTTCAACTTC 4200 

GAAATGACGT TCTGCCTTTT TCCTAATATC TACCACACGT TCATTCAAAT GAACTTCCGG 4260 

TTTAAAATAT AATCCTTGCT TAATTGTATC TTTTAAAATT TCATGACAAG GTTTTGGCGC 4320 

AATGCCGCCA ATATCCCAAA TAATTTTTTC AGGGTAAATT CTCATCTTAC CCGCTAATTC 4380 

AGATTGAACA TCTATCAATb TTACAGACAT ATCTCGCAAT CCAGCATAAA AGCTTGCATA 4440 

CAAACCAGAC GGACCGGCAC CAATGATTGT AACATCTTTC ATTATGTGCC TCCTATGACT 4500 

SO CTCTATATTC ATTTCTTTCA TTAACGTGCT CAAATTGATA ATTATTATCA TTTAAAGCCA 4 560 

TTATACTATT AATATTTATA TTGTTAAAAT AAATCGCATA GTTAGCCATG AATTATCAAT 4620 



55 



40 



45 



561 



EP0 786 519 A2 



GAAAGATGTG TATATTTTTT AGTTCTAGTT ATATTATTTT TTAAAAGACT CATCACGTGG 474 0 

TTCTTTAAGA ATTGCTTGTC TTAAAAGGAA AAATAGCAAC AATAAACCTG CAAGCATACC 4800 

TGTGTGCCCA ATACCTGCAA AGCCTGCnAA TGCTTCTGGA GAGTATGATT TACCAGTGAC 4860 

TTGGAAGAAT CCTTTTGTC 4 879 



(2) INFORMATION FOR SEQ ID NO: 90: 

10 

Ci) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1560 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

1S 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 90: 

20 ATAATGTCTT AGaTTGATTG GGAGTTTTTT TAATTTTTTT GAAATTAAAT TAATCTGTAs 60 

yTAATAAAAA ATTTGAATAA CTGACACAyT TTTTTGATCA TAGCTAyATA CTTTGTGAAT 120 
TAATTCACAT TATAATAAGA GTGAAGATAA GAGTATTATA AATnATCTTT AAATAAATAT 180 

25 ATGTGAAGTA AAAATTACAC GTTAGCATAT CGATTATGgT CATTTCkTTT AACATATTAA . 24 0 

CTgGGGaACG TTAAAAGTTA ACGGkTGATA TCyAACtAAA AACAAGGTCA CAGTAGTATG 300 
TTTTAATCTG GCGTCTATTA CAAATAAAAA TTACATCTAT AATTATTCGT TTTCTTTTTT 360 

30 GAAAGTAATA GCCAATTAAT ATCATACATA CTGGAGTGAC TATAAGGAGG ACATTATTAT 420 

GAGAGCAGCA GTTGTAACGA AAGATCACAA AGTAAGTATT GAGGACAAAA AGTTAAGAGC 4 80 

TTTAAAACCT GGTGAAGCGT TGGTACAAAC , GGAATATTGT GGCGTTTGTC ATACCGATTT 540 

35 

ACATGTTAAG AATGCTGATT TTGGTGATGT TACAGGCGTT ACTTTAGGTC ATGAAGGTAT 600 
TGGTAAAGTC ATCGAAGTTG CGGAAGATGT AGAATCATTA AAAATTGGAG ACCGTGTGTC 660 
TATCGCTTGG ATGTTCGAAA GCTGTGGAAG ATGTGAATAT TGTACAACAG GTCGTGAAAC 720 

40 

ACTTTG CCGT AGTGTGAAAA ATGCTGGTTA TACAGTAGAT GGTGCAATGG CTGAACAAGT 780 
TATTGTTACT GCAGACTATG CTGTGAAAGT ACCTGAAAAA TTAGATCCAG CAGCAGCGTC 840 

45 TTCTATTACA TGCGCAGGTG TGACAACTTA TAAAGCTGTA AAAGTAAGTA ATGTAAAACC 900 

TGGACAATGG TTAGGTGTTT TTGGTATAGG TGGTTTAGGT AACCTAGCTT TACAATATGC 960 
TAAAAACGTT ATGGGGGCTA AAATTGTTGC ' CTTCGACATC AATGATGATA AATTAGCATT 1020 

SO CGCGAAAGAA TTAGGTGCTG ATGCTATTAT TAATTCTAAA GATGTTGATC CAGTTGCAGA 1080 

AGTTATGAAA TTAACTGATA ACAAAGGATT AGATGCAACA GTGGTAACTT CAGTTGCTAA 114 0 
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TTTACCTGTT GATAAAATGA ACTTAGATAT CCCAAGATtA GTGCTTGATG GTATTGAAGT 1260 

AGTAGGTTCA CTTGTTGGTA CAAGACAAGA CTTACGTGAA GCGTTTG AAT TTGCTGCTGA 1320 

5 AAATAAAGTA ACACCTAAAG TTCAATTAAG AAAATTAGAA GAAATCAATG ATATTTTTGA 1380 

AGAAATGGAA AATGGTACTA TAACTGGTAG AATGGTTATT AAATTTTAAA AATATCAACT 1440 

GACTATATAG ATAAAGAAGG TAGTGCTCTG AACACTATCA TT ATT AAT CA AACCCCGAGG 1500 

10 

TTTTCCTGAA AAGATAGTGG nAAATCCCCG TGTTTTTTGG GTTTGAGGnG GTTGTnTGTA 156 0 

(2) INFORMATION FOR SEQ ID NO: 91: 

(i) SEQUENCE CHARACTERISTICS: 
15 (A) LENGTH: 11014 base pairs 

(B) TYPE: nucleic acid 
<C> STRANDEDNESS : double 
<D) TOPOLOGY: linear 

20 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 91: 





GTCCTGTnGC 


TGCAATGAAT 


ACGCCTAAAA 


ATCCAGGGAT 


GTAATGGATA 


CTTTGTGGTA 


60 


25 


GTACTAATGA 


TAGAAATGAT 


AAAAATGAAA 


TCACAAAGGC 


TACGCTCGCA 


AAAGCTTGAC 


120 




ATGTACGCTT 


ATCGCCATAA 


TCTAACCCTG 


TACGTATATG 


TAATAAATAC 


TGTAATCCGA 


180 




TACTTAAATA 


CATAATTGCC 


ACGCATAAGA 


AGAATGGGAA 


GAATGTCTTT 


TCAAAGTCCG 


240 


30 


GATATAGGCT 


GTTAGATAGG 


AAG AC CATGA 


TGAACATATT 


AAACATCATA 


AACGAGACGT 


300 




CTTTGAATGT 


AACTTGACCA 


AATCGATTTG 


TAAAAAATGT 


TTGATGAGAC 


CACATTAACC 


360 


35 


ATAAGAACAA 


ACTCATGACG 


ATGTATTTGA 


AAAATAAATC 


AGCTGAAATG 


GAACCGTTTT 


420 


GTGTTGTTAA 


AATCACATGT 


GCAATTTTTT 


GAATGGCATA. 


-GACGAAAATT 


AAATCAAAGA 


480 




ACAACTCATG 


GAATCCTGCA 


CGCTTTTCAG 


CTAAATGTTT 


TGGTGTTAAT 


GCATTAACCA 


540 


40 


TAAAATTTTA 


ACTCCTTTAA 


GATGTGTAAT 


TAATTTACTA 


AGTATACTAT 


TTA'rrriTTC 


600 


TAGTGAATAG 


GGGCAGATTT 


GGCGATGAAG 


TGGAAGGAGA 


GGTGACTGCA 


AGGTAATTGC 


660 




GGAATTAACA 


ATCATCAGCG 


ATTTAATATT 


TGACTGGAGA 


CGTCATGGTA 


ATAAAAAATT 


720 


45 


GATGAGAAAT 


TGATGGTGAA 


ACCAGCTGTG 


AATAsCGaTG 


cAATGATrsA 


TAGaATTTAA 


780 




TTAGAGTCAT 


TACGCGaAAT 


GATTAATGAT 


AATTTGTGGT 


AAATCAAAGC 


a TAATTTTGT 


840 




ACTATAGATG 


AGGATGATAG 


AGCATATTTA 


AGAGGGTGAA 


ATGTTAAAGT 


GAAACCGTTT 


900 


SO 


ACGTTTCCGA 


TTGCCCAAAC 


AAATTACATC 


ATTGTATAAT 


ATGATTTGTT 


AAATGCATAA 


960 




CAAGAATGAA 


AATGTAACAT 


ACGTAGCAAT 


TGGTTTCATA 


AATTGGATGT 


TAGTGGCGTA 


1020 



55 



563 



EP0 786 519 A2 



TGACGAGAGT CGTATTAGCA GCAGCATACA GGACACCTAT TGGCGTTTTT GGAGGTGCGT 114 0 

TTAAAGACGT GCCAGCCTAT GATTTAGGTG CGACTTTAAT AGAACATATT ATTAAAGAGA 1200 

5 

CGGGTTTGAA TCCAAGTGAG ATTGATGAAG TTATCATCGG TAACGTACTA CAAGCAGGAC 1260 

AAGGACAAAA TCCAGCACGA ATTGCTGCTA TGAAAGGTGG CTTGCCAGAm ACAGTACCTG 1320 

CATTTACGGT GaATAAAGTA TGTGGTTCTG GGTTAAAGTC GATTCAATTA GCATATCAAT 138 0 

10 

CTATTGTGAC TGGTGAAAAT GACATCGTGC TAGCTGGCGG TATGGAGAAT ATGTCTCAAT 1440 

CACCAATGCT TGTCAACAAC AGTCGCTTTG GTTTTAAAAT GGGACATCAA TGAATGGTTG 1500 

15 ATAGCATGGT ATATGATGGT TTAACAGATG TATTTAATCA ATATCATATG GGTATTACTG 1560 

CTGAAAATTT AOTAGAGCAA TATGGTATTT CAAGAGAAGA ACAAGATACA TTTGCTGTAA 1620 

ACTCACAACA AAAAGCAGTA CGTGCACAGC AAAATGGTGA ATTTGATAGT GAAATAGTTC 1680 

20 CAGTATCGAT TCCTCAACGT AAAGGTGAAC CAATCGTAGT CACTAAGGAT GAAGGTGTAC 1740 

GTGAAAATGT ATCAGTCGAA AAATTAAGTC GATTAAGACC AGCTTTCAAA AAAGACGGTA 1800 

CAGTTACAGC AGGTAATGCA TCAGGAATCA ATGATGGTGC TGCGATGATG TTAGTCATGT I860 

25 CAGAAGACAA AGCTAAAGAA TTAAATATCG AACCATTGGC AGTGCTTGAT GGCTTTGGAA 1920 

GTCATGGTGT AGATCCTTCT ATTATGGGTA TTGCACCAGT TGGCGCTGTA GAAAAGGCTT 1980 

TGAAACGTAG TAAAAAAGAA TTAAGCGATA TTGATGTATT TGAATTAAAT GAAGCATTTG 204 0 

30 CAGCACAATC ATTAGCTGTT GATCgTGAAT TAAAATTACC TCCTGAAAAG GTGAATGTTA 2100 

AAGGTGGCGC TATTGCATTA GGACATCCTA TTGGTGCATC TGGTGCTAGA GTATTAGTGA 2160 

CATTATTGCA TCAACTGAAT GATGAAGTTG AAACTGGTTT AACATCATTG TGTATTGGTG 2220 

GCGGTCnAAC TATCGCTGCA GTTGTATCAA AGTATAAATA ATAAGAAAAC AGGTTATCAC 2280 

AACA^TATTA ATtACATGTT GGCATAACCT GTTTTTATTT GTTTATGGAT TTATTGGGTA 2 34 0 

ATATTAGTCA TTTGATGGTT TAATTGCAAA TGCTCTAACA GGGAACCCAG GTGCATCTTT 2400 

40 

TGGTTTAGGG CTGATAGCGT AAATGATGGC GCCACGAGTT GGTAATTGAT CTAAATTAGT 2460 

TAATAACTCG ACTTGGTATT TATCCTGACC AAGAATATAA CGTTCGCCAA CTAAATGACC 2520 

4S ATTTTTTACA ACGTCCACAG ATGCATCGGT ATCGAATGTT TCATGACCAA CAGCTTCAAC 2 580 

ACGACGTTCT TCAATTAAGT ACTTCAAAGC ATCTAATCCC CAACCCGGTG CATGTTGTTG 2640 

TCCGTTCGCA TCTTTGTTTT CAAACTTTTC AATATTAGGC CAACGTTTTG ACCAATCGGT 2700 

50 ACGAAGTGCA ACAAAAGTGC CAGGTTCAAT AGTACCATGC TCTTTTTCCC ATGCTTCTAT 2 760 

ATG CGCACGT GTTACGATGA AATCATTGTT GTTCGCTACT TCTGTTGAAA AGTCTAATAC 2820 
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AAAGTGAATT 


GGTGCATCAA 
x vwi x win 


TGTGAGTACC 


ATATTGCGTT 


ACAATATTCC 


AACGTTGCAC • - 


2940 




ATAGAAACCA 


T'GA'TPTTT A A 


CCGTGAATAA 

\v x win x **** 


AGTTGAAACT 


TGGCCTTTTT 


CAAACTCACT 


3000 


5 


AAA A PGTGGT 


X 4W\>VJvAi 


CAAATGTATG 


CGTTAAATCA 


ACCCAAGTTG 


CTTGTTTTAA 


3060 




AGTATTTAAT 


TGTTGPCATA 

X W X X W\v\a-f%XT% 


AAGGATATTG 


TGTCATAAAA 


TCACCCGTTT 


TTAGTTTATT 


3120 


10 


ATATGATAAA 
Ainivininnn 


*TYlf 'Tf* PG A TT 

- X X X 


attpttggcg 
xwxxwwvj 


TTTAGCTTTA ACAGCATTCA 


CAAGCACAGT . 


3180 


PA ATGPATPT 


X X*vll. X X V— X X 


Vw X 1U1 1 X X V— w 


CGTTTTTAAA 


CCACAGTCAG 


GGTTTAC CCA 


3240 




vxMA I AA 1 IjAvj 


UuvilV.unl X X 




ACGATTGATT 


GCTGTAGTAA 


TTT'CTTCTTT 


3300 


15 




f^fiTfitz a rr a*r 

Cv? xwV»Al~ inl 


GAATTaTPATA 
VanninXUilA 


TACACCTAGA 


CCAATACCTA 


AATCATAATT 


3360 




AATATCTT CA 


AAGTCTTTAA 


x iAnAlUiLU 


ATGGCTACGA 


GATGTTTCAA 


TTGAAATAAC 


3420 




ATCAG CATCT 


AAGTvUATviAA 


X AwuAJluAA x 


GATTTGACCG 


AATTGAGAAT 


AACACATATG 


3480 


20 


TGTATGGATT 


TGAGTTTCAT 


CaLajAAC 1TJA 


AGACGTTGCA 


AGTTTAAATG 


ATAAAACAGC 


3540 




ATCTTTAAGA 


TATTGTTCGT 


GAT A 11 LAbA 


GCGTAATGGT 


AAGCCTTCAC 


GTAATGC!AGG 


3600 




TTCGTCAACT 


TGGATAACTT 


TGATTCCTGC 


AGCTTCAAGT 


GCTAATACTT 


\a. X XwwX IVJnl 


3660 


25 


TGCTAAAGCA 


ATTTGATCTT 


GAACGAL 1 I 1 


ACGTGGTAAA 


TCAACACGTT 


PAAATGAPC!!A 


3720 




GTTTAGAATT 


GTTACAGGTC 


C-AGTTAACAT 


ACCTTTAACT 


GGTTTATCTG 


X ±f\t\\3\— X X XVJ 


3780 




TGCATAAACT 


GTTTCATCAA 


CZAvj I lAAAUvj 


CGCTGTCCAT 


TTTACATCAC 


PATAAATGAT 


3840 


30 


TGGTGGTTTT 


ACGG CACGTG 


AAL L_A 1 A x\a A 


TTGCACCCAA 


GCGAATTTAG 


TTAGTAAG AA 


-3900 




ACCTTGTAAT 


TTTTCTCCGA 


Aurnnl lUAAU 


CATG TCATTA 


CGTTCAAATT 


CACCGTGAAC 


3960 




TAATACATCT 


AAbLLAA x\j X 


Ciltl 1 vaAAx 


TTTAATC GAT 


CGAGCAATTT 


w^*x x x x x 


4020 


35 


GAATGTTTCA 


r|t 71 rr^/^ / vi ■ 11 1 1 a 1 * 1 1 
1A1 X X ^-vi 1 




XX XwXXVwXXn* 


CAATCTGCAC 

^a^W^X ^ X WW1V . 


GGTATTTTCG 


4080 




AAv. x _i A v^vjvj 




ATGATPPAAT 


AGTTGTTGTT 


GGTAAATCCG 


GTAAGTTCAA 


4140 


40 


ACGTTTTTGT 


X Vj7 X 1 X X VJUi 


T APGTTGPGP 


GAATGGTGAT 


TGTCTTGAAG 


TACGCACGCT 


4200 


1 1 CljAAAx A 


T A A T PT A AGT 


X X X X u/Vll VJ^» 


TTGATTTTGG 


AAACG CTCAT 


AACGTGCTTT 


4260 




Innl x i. Al y — K 


X x\ X X InniJW, 


T ATPGTTTTG 


ATTAAATAGG 


CGACGCAATG 


CATCT AATTC 


4320 


45 


GTCTAATTTT 


TCAGTTGCAA 


AGCTTAAGCC 


TTCGCCAACA 


CTTGTATCTA 


ATGTTTCAT C 


4380 




ATCTAAAGAT 


ACTGGAACAT 


GTAATAATGA 


AGATGATGGT 


TGAATGACAA 


GTTCATTAGT 


4440 




GTGTGCTAAC 


AATTTATCGA 


TTAAGACTTT 


TTTAGCTTCA 


ATGTCACTTG 


CCCATACATT 


4500 


SO 


ACGACCATCA 


ATAATTCCAG 


CGTATAATGT 


TTTTGATTTA 


TCAAAATCTC 


CAGCTTCAAT 


4560 




TTGTTTAAGG 


TTATAGC CAT 


TATCATGGAC 


AAAGTCTAAA 


CCTATACCAC 


CAACAGGTAA 


4620 
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AACACCAGCT TTTTCGAAAT AGTCATAAGC TTCACGTGTA ATATTTTCAT AGCTTTCGCT 474 0 

GTCGTCTGTA ACTAAGATTG GCTCATCAAC TTGAATGTAC TCAGCACCTG CATCAATTAA 4 800 

5 

TGATTCAAAG ACTTCTTTAT AAAGTGGTAA TAACGTTTTA ACTTTTTCTT CAAAAGTTTG 4 860 

GTGACCGCCT TTTGATAATT TAACAAAAGT AATCGGACCA ACAATGACAG GGTGAGCGTT 4920 

AACGTTTAAA GATTGGGCAT ATTTAAAGCG ATCTAATAAT ACATTGCGAC TCACTTTAGG 4980 

10 

CTCAACATTG TCCCATTCAG GTACGATGTA ATGATAGTTA GTGTTAAACC ATTTTATAAG 5040 

TGCACTTGCA ACATGGTCTT TATTACCGCG AG CAATATCA AATAATAAAT CATCATCAAT 5100 

1S AGTTCTT CCT TGGAAACGTT CAGGGATGAT GTTGAATAAT AATGACGTAT CTAATATATG 5160 

GTCATATAAA GAGAAATCAC CAACTGGGAT GCTATCTAAG TGATAGTACT TTTGtAATAA 5220 

TAAATTTyCT TTATGTAGAT CAGTTAATGT TTGATCTAAT TCTTCTTTAG AAATCTTCTT 5280 

20 TGCCCAATAA CTTTCGATGG CTTTTTTCCA TTCTCTTTTT CTACCTAATC TTGGGAATCC 5340 

TAAGTTTGAT GTTTTAATTG TTGTCATAAT ATTGCCTCCT TGTGAGCAGT AATAGATTTT 5400 

GAGTATGCTG CAAGTTCTAA TGAATCTTCG ACATTTTGAA ACGGTGTGAT AATGTATAAA 5460 

25 CCATTAAAAT ATTCATGAAC AGTATCGATT AAATCCTTTG AAAGCTTAAG ACTTAGTTCT 5520 

CGTGT TT TGG CTTTATCATC TTTAACTGCT TCAAATTGTT GTAAAATTTC ATCTGACATC 5580 

TTGATTCCTG GCACTTCATT ATGCAAAAAG AGTGCGTTTT TGTAACTTGC GATAGGCATA 564 0 

30 ATGCCTATGA AAAATGGTTT GTTCAAGTGC TTAGTGGGAT GGTAAATTTC AATGATTTTC 5700 

TCTTTGCTGT ACACGGGTTG TGTTATAAAA TAAGACATTC CGCTTTCTAT CTTTTTCTCT 5760 

AATCTTTTGA CGGCAC CATA TAATTTACGA AGATTAGGGT TAAAGGCGCC AgcGATGTTG 5 820 

35 

AAGTGTGTAC GTTTCTTCAG CGCATCACCG TCAGTGTTAA TACCTTGATT AAATCTTAGA 5880 

GCGSGTTCAG TTAATCCTTT AGAATTAACA TCATAGACAT TGGTTGCACC TGGTAAGTGA 5940 

CCAACTTTTG AAGGATCACC AGTTATGGCT AATATTTCGT TAACGCCAAT GAGCGATAAT 6 000 

40 

CCAAGTAAAT GGGACTGCAA GCCGATTAAG TTTCGGTCTC GACATGTAAT ATGTACGAGT 6060 

GGTTCAATAT TGTAATATTG CTTAATTAAG CTAGCAGCAG CAATATTGCT AATTCTGACA 6120 

45 GTTGCCAATG AATTATCTGC GAGTGTTACC GCATCTACAT TAGCTTTATC AAGTTTAGCG 6180 

ATATTTTCAA AAAATCTATC CGTGTCTAAA TGTTTCGGTG TATCCAATTC GATAATAACG 6240 

GTTGGACGTT CTTGAAC CTT AGATGTTAAT GATTGTCTAA CTTTATTTTG AGATGGATTG 63 00 

50 AAAAGTGCTT TCGTTGGTAT CGGAATCACT TTTTTGTCAT TAACAGGTTT AAGTGTCTGA 6360 

AT AG ATT CTT TAATAAATTT GATGTG CTCT GGCGTTGTAC CACAGCAACC ACCAATTAAA 6420 

£5 
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TACTTAAATT CACTATTTTC AATATCTAAT 
GCGTGCTCTG GTAATTCAAT ATGTGTGAAA 
CAATTGAGTC CCACGATGTT TGCACCACAT 
GCCTGACCAT TAACTAAGTA ATTTGTGTTT 
TCGTATTTCT TTCTCGTTCG TGAAATGACA 
TCGAAAAGTA GCGCGTCAAC GCCTTCTTCA 
TAAAGAATAG TTTGTAAGCT GATATCCTCT 
CCTAATATAT ACGTATCTTT ATTTGCTGCT 
ATTGCTTTAA CTTTATCTTC AAGACCGAAT 
GTATTGGTTT GAATGACATC AGCACCGGCT 
TTATCTGGAT GGCTAAGATT ATATGCTTCT 
ATGGTTCCTA TAGCGCCATC AGCTACTAAA 
CTCATTGAAT GCCTCCTTTA ATGCGTATTT 
GAGACCAACA CTTAATCGGA ATAGACCGAA 
AGGTAGTGCA GCGTGAGACA TTGTTGCTGG 
ACTCACTGAA ACGAGTGGTA ATGTCAGTGC 
AGCTAAACGA AAGCCAATAA CGGCACCGCC 
GAGTCCCGGA TAATAAACTT CTGAAATTTC 
TTGAGCGTTT TCGACAGATT GTTTAAATCT 
TGTCCAGCTA TCCTGAGCAG ATAACATATT 
GTCACTAATT GCCTCATTAT TAGTTATGAC 
TAAAAATTTT GTAGCACTAT GAATGACAAT 
TAAGGGTGTC ATAAATGTAT TGTCCACAGC 
AGAAACAGCT TTGATATCAG TAATTTTAAA 
TAATTTTGTG TTTGATTGAA TGGCACCCTC 
TGTAAATTCA ATATTAAATC GATTCAAAAT 
TACATCATCG GGTAAGATGA CATGATCACC 
AGCAGCAATA CCTGATGCAA AAGCAAAAGC 
CTCTTCTAAA AGTTCACGGT TAGGGTTGCC 



AAGCTGGCAT TTGGATAACA AGATAAGAAT 
GACTCTTGCA TATGGTGCGG GCCATGATGA 
TGAACGAGTT GTTTTAATCC TTCATTGATT 
GAAGCGGTTA ATTGAGCAAT GATTGGAATG 
TTTGTTAACT CTTCTAGGTC GTAATACGTT 
ATTAAGGTGT CTATTTGAAT TTCAGTATGA 
TGTTTGATAC CTCTAAACCC ACCAACTGTG 
TTTTTTGCGA TGCGAACGGC GGCTTGATGT 
CGTTTTAACT TTTCAAAATT TGCACCATAA 
TCAATATATG AACGATGGAT GCGTTCAACT 
GGACAGGTGT CTAATCCTTC AGAGTATAAA 
ACATTATCTT TCAATTGTGT GAGGAATTGA 
GATGTCTGCA ATGAGTT CAT CAGGATCTTC 
AGTGATACCA CGTTCTTGTC TCACTTCTTC 
ATGTGAAAGG AT CGTTTCAA CACCGCCCAG 
ATCGACAAAT TGTTGTGCTT TAGACTCATC 
ATTTTTAGCT TGTTCTAAAT GAGCAGTAGT 
AT CTTGCTTT ATTAAAAATG ACACGATTTT 
GATTGGAAAA GTTTTTAAAT GTTTAGCAAG 
GCCTGTACCA. TTTTGTATTA AATAAAGAGC 
AGCACCAGCA ATTAAATCGC TATGTCCACT 
ATCAGCGCCA- AGTAATAAAG GTGATTGACc 
TACCAGTAGT TCATGCTTTT CGGCTATTTT 
ACAGGGATTC GATGGTGTTT CGATATAAAT 
GATTTGTTCG AGCTTTGTAG TATCTACGGT 
TTGCT CAGTG AGGCGAAAAG TACCGCCATA 
AGATTTGAAA GTCAAAAGTA CTGCTGAAAT 
GAATTTTCCC TGTTCTAATC GTGCTAACTT 
CTTCGTGCAT AATCATATTT AACATCGCCA 
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TCCACACCTC 
CTCCAATCTG 
CAACACCTAG 
CTGGCATATC 
AACTTTCTGC 
TGTTAAGTCT 
GAAGTGACTG 
AATGCAAAGT 
CAGTCATGTT 
CACCTGCTAG 
CAGCACCTTC 
ACAATAAGCC 
GTGGGTTAGA 
GTTGTTCATA 

ATTCAAATAA 

* --f 

GTTTAAATAG 
CAATACCATG 
TACGTGTATA 
AATGGATTGG 
GTGTATCCTT 
TACCCGAATG 
GTTATTC CAT 
ACAATTATCA 
TAACAAAAAA 
TCG CTATAAC 
TCAAACACGC 
GTTTTACTTy 
CTTACAGAGT 
TTTGTTTGTG 



TACGCCAATC 
AGCTTTATCT 
TGATAAGCGG 
AACATGTGTT 
AAAAATGCAA 
TAAACTAAGC 
ACATTTTTTA 
TTTAAGTCCA 
GTGAAAATCA 
TACATCGTTA 
TGCTAGTGGT 
TTT AG CTTT A 
TATTGGTTCA 
ATCTGTAAAA 
TCTAAATGTG 
ATTACATATT 
CTCAAGTTTG 
ATCAAAACCT 
ATTCGCTATA 
CAT ATT AAGA 
AATCGGATAA 
CGCTGAAATA 
CAATTAAAGT 
TCGTGCGTAA 
GGGCGAACCC 
TTtCAAAATC 
CCTCTTTATT 
AAAAAAAGAT 
AAATTGTAAT 



GAATATCACT 
AATGCTTGGA 
ATTAAATACT 
TGGGTGTAAG 
ATGTCTAAAT 
ATGCCAGTTT 
GCAAGTTTTC 
CGTAACAACA 
AACAACTGTT 
TGTCCGCCAA 
GTTGAAAGAT 
CAAAGTTGAT 
ATGAATAATG 
TCAACGTACT 
CCACCATATA 
AATTGAATGG 
GCAAAACAGG 
GTCGATTGTC 
GCACCGGTTG 
CCCTCCTATA 
AAAGGACGAA 
ACCTTATTGA 
CAGTAAGTAA 
AGAATCCAGT 
GTAGACACCT 
TTCTCTCAGC 
GTGTTTACGT 
TTGTCAACAA 
TGGTATCTTG 



TCTGTCTCTT 
TGATATCGCG 
CATGAATGCC 
GGAAGGTCAC 
TTT CTAATAA 
GCCCGCTATA 
TAGCGTTTGA 
AATAACTATC 
GCGCGAGTGA 
TATATTTCGT 
AAGGTGTTAA 
AGTATGGCTT 
CAACTGTTTT 
TAAATTTGAT 
AATCGAATGA 
CTGACATTCG 
TTTCAAATGT 
CTAGTTTTGG 
AATCATCGGT 
AGAAAAAATA 
AGCTTATGTT 
GTACGCATTA 
GGATATAGTA 
AOGCCATTTA 
CATATTGGCA 
TACTAAAGAC 
TTCATTAAAC 
TTATTCAGAA 
AAGTTGAAAA 



TTGAAAGTGT 
TTCGATGTCT 
ACGTTTATCT 
TAATGTTTCA 
TTTAGCGACG 
TAGTACTTCG 
TTGCGCACGC 
TATTGGTGAA 
TTCATCTTTG 
GGCTGAATGT 
AAAAGTATTG 
TACATCAATA 
ATCAGTGATT 
ATCGTATTGT 
AACTAAAATT 
ACTTGATGTA 
TGAGCGTGTA 
ATGCTTGTAG 
TAATGTGATT 
AAAAAAGCTT 
TCGGGGTACC 
AAAGTAAATA 
ATGTGCTATC 
ACATCAATGT 
TCAACACTCC 
TCTCTGTATA 
TGTTATAAGA 
AATTTTGATT 
ATGAATTATT 



CATACAATCT 
TCATAATTTT 
TTTTCAGCAT 
GTACCTCCTA 
CTATAGGCCT 
TCAATTGCTT 
TCAATGCGTA 
AGTGTTGCGC 
ACGGTTACGA 
AAGACTATAT 
TCGATAATTG 
GCAATCATTT 
TCTTTTTCAA 
TGCTCGTAAA 
TCATCATGAG 
GCGAATGATG 
GGATTTTTAG 
GCAGTAGATA 
TGGGCTAACT 
CCGTCCTTCG 
ACCTTTATTT 
TGCTTACTGA 
CCATACTTAT 
TAATACTGTA 
AAGGCCATTT 
AGCAGGGTGT 
TATTAATTAG 
TAAAAGTTAA 
TTTTAAATAA 



8340 
8400 
8460 
8520 
8580 
8640 
8700 
8760 
8820 
8880 
8940 
9000 
9060 
9120 
9180 
9240 
9300 
9360 
9420 
9480 
9540 
9600 
9660 
9720 
9780 
9840 
9900 
9960 
10020 



55 



568 



EP0 786 519 A2 





TCAAATAAAA 


AGTGATGTGA 


GTGAATTGTC 


AAAAAGTGAA GATCAACGTA 


TTACTAAAAC 


10140 




AAAAGATGAA 


CAAATTAAGC 


AAATAGATAT 


ATCGGATATC 


AAACCGAATC 


CGTATCAGCC 


10200 


5 


CCGAAAAACT 


TTCGATGAAA 


ATCATTTAAA 


TGATTTGGCA 


GATTCAATTA 


AGCAATATGG 


10260 




AATTTTG CAA 


CCAATTGTGC 


TTAGAAAAAC 


. AGTTCAAGGT 


TATTACATTG 


TAGTTGGTGA 


10320 


10 


AAGAAGGTTT 


AGAGCTTCGA 


AAATTGCTGG 


TCTAAAATAC 


GTATCAGCGA 


TTATCAAAGA 


10380 


TTTAACAGAT 


GAAGATATGA 


TGGAACTGGC 


GGTCATCGAA 


AATTTACAAC 


GAGAAGACTT 


10440 




AAATGCGATT 


GAAGAAGCTG 


AAAGTTATCA 


ACGTTTGATG 


ACAGATTTGA 


AAATTACACA ' 


10500 


75 


ACAAGAAGTA 


GCGAAACGAT 


TGAGTAAGTC 


GCGCCCGTAT 


ATAGCGAATA 


TGTTGAGGTT 


10560 


ATTACATTTG 


CCGAAAAAGA 


TTGCTGACAT 


GGTAAAAGAT 


GGGCGACTGA 


CAAGTGCACA 


10620 




TGGACGAACG 


TTATTGGCAA 

x x**x ASTVwm 


TTAAAGATGA 


ACAACAAATG 


CTTAGGTTAG 


CGAAACGGGT 


10680 


20 


TGTTAAAGAA 


AAGTGGAGTG 




nutnnnn^Lnl 


GTTAATGAAT 


TAAAAAATGT 


10740 




TTCGTCAAAG 


TCGGAAACAG 


ACAAAGTAGA 


TATAACTAAG 


CCTAAATTTA 


TAAAGCAGCA 


10800 




AGAACGACAG 


TTGCGAGAAC 


AGTATGGTAC 


CAAAGTAGAT 


ATATCAATAA AAAAATCGGT 


10860 


25 


TGGTAAAATC 


TCATTTGAGT 


TTGATTCACA 


AGAAGATTTT 


GTGAGAATAA 


TTGAACAATT 


10920 




AAATCGTAGG 


TATGGTAAAT 


AGTTACACAA 


TTTTATATAA 


TAACTCTTTG 


TGCAAGTGTA . 


10980 




AATAAATTGT 


AATCAGTG AC 


ATTTGATTCT 


AGAT 






11014 



30 (2) INFORMATION FOR SEQ ID NO: 92: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6022 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

* (Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 92 : 

40 

TCCCCTTATG GAATTTCACA TTCTAGTTTA CATAATATAT ATTATAGGAA GTTATATGTG , . 60 
TGTAACGCAA AAgGTACCCT ACATCATAAT CATTATCTAA TATCGTCACA TAACTTACTT 120 

ATGCTATAAT CATGGTATTA TATTGTTTGG AGTGATTTGA TGAGATTTGT CTTTGATATT 180 

45 ....... 

GATGGTACGC TTTGTTTTGA CGGCCGATTA ATTGACCAGA CTATTATTGA TACATTGTTA 24 0 

CAATTACAAC ATGATGGTCA TGAACTTATA TTTGCATCAG CACGTCCGAT TCGTGATTTG 300 

50 TTGCCAGTTT TACCATCAGT ATTTCATCAG CACACATTAA TTGGCGCAAA TGGTGCTATG 3 60 

ATTTCACAGC AATCAAAGAT TTCTGTTATC AAACCAATTC ATACTGATAC ATATCATCAT 420 

55 
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GCTGCACAAC TTGACGCTGn AGAACGCGAT TTTTGAGCGT TTAGATCCAC ATAAGCTGGC 54 0 

CAGTTGTATT GATGTTGCAA ATATCGACAC GCGAATCAAG AkTATTTTAT TAAATATAGA 600 

5 CCCGGCACAA ATTACAACTA TATTAGACGA GCTAGATAAA TACCATCAAG AATTGGAAAT 660 

GATTCACCAT TCAAATGAGT ATAACATTGA TATAACAGCG CAAAATATTA ACAAATATAC 720 

TGCATTACAA TATATATTTG ATGCAGATGT TAAATATATA GCATTTGGTA ATGACCACAA 780 

10 

TGATATTGTC ATGTTACAAC ATGCTAGTAG TGGCTATATT ATAGGACCAT CAGAAGCATA 840 

CACACACGCA ATATTGAAAC TTGATAAAAT CAAACACATC AATAATAATG CACAAGCTAT 900 

TTGCAAAGTC TTAAAATCAT ATAAATAAAA ACACCCCTAT CAAATGATAA TCATTATCAA 960 

TCGATAGGGG CTATTTTAAT AAAATTCGTC CTCGAACATT TCTTCCTCTT CATCTAATCC X020 

AAATAATTCT GCCATTTCTC CATGTTCAAT TAACATGTTT AAATATGCAT CGCGGAGTTC 1080 

TtCTTCACTC ATATCATTAA TCATTTCTTT AAGACTATCA ATCCACATAT TTCTGCGTAA 1140 

20 

TTGATAGTCT TCTTCAACTT CGTTTAACAT CATTATATGT TTATTTGCTG CTTCTGGACT 1200 

AGCTGTAAAG AGTAATGCAA TCATATGTTT ACATATCACT CGTCTTCCAT CAGCATGAGG 1260 

25 ACAATTACAT ATGGATTTTC TAGGATGTTC CATATCAATA TAACAACGAT ATACTTTGTT 1320 

GCCACTGCCC TTTACTTCAG CCTCATGCTG CGTTTCTGAA AATGATTTTA AGTTAATGAC 13 80 

GCATTCACTT TGATAATAAT TAAAGCCTCT TTCTATAGAA CGAATACTTG CAATATCAAG 144 0 

30 TAATC CCATT AATGaTACTC CTTTTTATTA TTATTTTTAA ATAAAGAaAA TAAAATAGAT 1500 

AAGTGTCTAG ATTAAAATAC TTGATTTATC T AT ATTTTAT AACAAGTCTA GAATTATCGC 1560 

ATTCTTAAAT AACTAATATG AAAATGcTTG CACTAATTCt TTTGTATAAG GGTGTCTATC 1620 

35 AACATTAAAT AATTCCtCTA TTGCAAAATC ATCGACTATC ATGCCATCCT TAAGAACGAT 1680 

AATTCTATTA ACTAAGCGTT GTAACACGGA TAAATCATGA GAAATAACGA TAAAATGATT 1740 

TAAGTTCGTA ATCGTTTGCG CTTTTAATAT ATTGATTACA TTTTGTTCAG CTATAACATC 1800 

40 

TAAATTTGAA GTTATCTCAT CA CAT ATT AA. AACGCGAGGC TGTG CTAATA ACGAACGCAT 1860 

GACATTAAAT CTTTGTAATT GTCCGCCACT CACTTCGCTT GGTAATTTAG TCAATAATTG 1920 

CGCGTTTAAC TCAAAAGTAG ATAAATGTTG TAATAATAAT TGATCCTGAG CAGTATTATC 1980 

45 

AGTTAGACCT CTGTAATAAT ATAACGCTTC TTTTAATGAG GTCTCAATCG TCCAATGAGG 2 040 

GTTAAAGCTA GTTAAAGGGT GTTGGAAAAT CGGTAACACA GCATTGTCAC TTAAGTAAAT 2100 

CTCTCCTTTA ACAGGTTTAA ACAAGCCAAG AACCAATGAA GCGAGCGTAC TTTTACCACA 2160 

SO 

GCCACTTTCG CCTAAAATAC CAACATTTTC TCCATCAGGT ATAGTAATAT TGATATCTTG 2220 

55 
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CCCTCTTTAA TTGTGTTCTA TATTTAATTA GACGTTCAGT ATACGGATGC AAATGCTCAT 2340 

ACTTGAAATG ATTAATATTA CCTCGTTCAA TGATTTGACC TTCTTTTAAA ACATAAATGT 2400 

5 ACTGACAATA TTTCAATACA TGACTTAAGT TATGTGTGAT AATAAATAAT GTTTGAC CAT 2460 

GTTCTAATAC AATATGCTGT AATAAATCCA TCACTTGATT ACCGTTCAAA GCATCCAATG 2520. 

ATGCAACTGG TTCGTCTGCA ATGATTAATT TAGGCTCCAA CATGAGAACG CTTGCTATGT 2580 

10 ATACG CGTTC AAGTTGGCCC CCAGAAAGTT GGAAACTATA TTTATTTAAT ATATCTTTGC 2640 

TTTGTAAATT AACCCACGAC AAAGCCTTAT CAACTTTGGA CAAAGCCTCT TCTTTACTAC 2700 

CTTTATAATG CTTACGATAA ATOGCAGTTA ACTGTTTACC TAATTTAGTA TGGTCGTTAA 2760 

15 AACTTTCTGC ATAATTTTGA GAAATATAGC CAATTGTATG ACCATAATAT TGACTCAATC 2820. 

TACTAACATT TTCCCCATCA AATTGGTACG AATCATACGT GCAGCTTAAA TCAAATGGTA 2880 

AATATTCAAG TAAAGCTTTA GCAATCAAAC TTTTTCCAGC GCCGCTCTCT CCAATCAAGG 2940 

CATTAATCTG TTGACTAAAA ATTTTCAAAT CAATCCCTTT AATAAGAGAT TTCTCACTAG 3000 
TATTCTTTAT TGTTAAATTT TGTATATCAA TGAGACTCAT CATATTCACC CCGTTGTTTC , 3060 

AGCAATCTAT CTCTTAGTGC ATCACCGGTT AAATTAAAAA TTAAAATAGT TATAGCAATG 3120 

ACTGAAGCAG GTGCAATCAA CATAATTGGA TGAGACGAAA TAAAATCACG ACCTTGTTGC 3180 

AACATAGCGC CCCaCTCTGG TGTTGGCGGT TGTGCACCTA ACCCAATAAA TGATAGTGAA 3240 

CTTATATATA GAATGATTTT ACCGAAATCA ACGACCATCA AAACGATAAT AGCCGGTATA 3300 

ATTTTAGGTG TTAAATGACG TATTAATATT GTTCTTGTTG GTACATGAAA T AATTGTG C C 33 60 

ATTTTTATAT AAGGCTTATT CATTTCGCTA TTAACTATAC TTCTAGTCAA CCTTGTGTAA 3420 

TT CAT CCATT TTATTAATGT AATTGAGATA ACTAAATTCC ATAAAGATGG TTGAAAAAAA 34 80 

CTTGcTAAAG CAATCATGAT GATAAATTCT GGAATACTTA GACCAACATC AATAAACCTT 3540 

AACACTAATC GTTCAATCCA CCCTTTTTTG TATCCGGCAA ATAGACCTAG TGTAACACCT 3600 

40 ATGACAACGA TAG CTATT AA TGTTAAAACA GTAACAAACA ATGTTGAACG TGCACCGATA 3660 

ATAATTCGGG TAAATAAATC TCTCCCATAA TCATCAGTTC CTAATAAATG CAACCAACTA 3720 

ATAGGTTCAA AAGTTTGTGA TAAATTGACT TTGGTTGCAT TTTCACTACT GACAAAGAAT 3780 

45 TGCAGTACAA TTACCACAAA AATAAATGCA ACGAATACAA AAAATATCAG GTTATTCTTT 3840 

GAAAATATTT TATGCATGAC GGTCACTACT TTCTGATATC AATGGTGTAT TGGTTTTGAT 3900 

TTTTGGATTT CCTAATTGTA AACGCTGCTT CGGATCAAGT AATAACGTTA ATAAATCAGC 3960 

AATCGTATTG ATAATAACAA CGAAGAAGCC AATAAATAAC ACGCATCCTT GAATAACAGG 4020 
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15 



ATTTTCAATC ACTACAGTAC CACCTATTAG ACTGCCAAGT GAAATCCCTA GTAATGGGAT 414 0 

AATCGGCAAA ATTGTTGGTT TTAGTAAATC ATGAATTAAA ATATAACGTT CATTCATACC 4200 

GCGTAATCTT GATGCTTGTA CGATATTACT TTGCAATAAC ATCAATAAAT TAGAACGCAC 4260 

TAAACGAATG ATGTATGCAC ACATACCTAA AGATAGCGTG ATTACAGGTA ATATAAACTG 4320 

ACTTAGTATA ACGCTATCTA TATTCATTAA ATTTGTGACA ATAAATAATA AAATAATACC 4380 

GATAAAGAAC GCTGGTAAAC TAATCGATAG TGTTGAGATC ACTCTAATCA CTTTATCCGT 444 0 

CCACTTATGA AATCGTTTGG CTGCTATAAT GCCGAGCGGT ATAGATATGC ATAACGACAC 4500 

TACTAATGTT GAAAATGATA TGAGTAATGT TATGGGTGCA TAGTTGAATA ATATCTGTGT 4560 

TACCGGTTCT TTTGATTCAA AACTTTTTCC TAAATTAAAA TGTAATAAAT GATTCATCCA 4 620 

ATGCCACCAG TGTACCAATA AAGAATCATT TAATCCCAAT TTATCTTTGG TTGCATTTAT 4680 

TTGT T CCGTC GACACTTGTG CTACATCAAG ATGTAATATT TTATCAACAG GATTGCCTGG 4740 

20 

TGATAATTTC ATTAAAATGA ATGTAAGTGT AGAAATAACA AATAAAACAA CTATCATTTG 4 800 

CATCAGTCTA TACAACATAG ACTTTATTAT GAACATAATA GTCCCCCTCC TTGTGTAAGT 4860 

25 TACTAACACT TTCTTTTTAC ATGAGAATGG CGCATGTATA TGCAACTTAC ATATTAAGAA 4920 

CTAACGTTCA TTATAGTATT ATCCATAAAG AAATTGAAGT ATATTTAATT TTTTAACAAA 4980 

ATCATTATAA AATATAATAT TTTGAATCAA GTCAACCATG TAAAATATAA AAAAGTCAAA 5040 

30 ACAAAAACAA CTATAGCACT GTATTCCATC TCTTTCGAAA TAATTGTTAC TGCAGTGTAA 5100 

CTTAAAAGTC GATGATTTTG TGCATATAGT TGTCGAATAT TATTTTTTAT CTTTACGGCG 5160. 

AAGTTCAGCG CCCTCATAGC CGTATTTTTC AATTTGCTTT TCTAATTTAC GCGCTTTTCT 5220 

35 TTCTTTACGC CAATTTCTAG TAAAATACCA TAATAGAAAA CTAATTAATA AACTCATAAT 5280 

CGCTAAAAAT GCAGCGTATC CTAATAATGG TTGATATTTT ATATCTTGAA AATTTGGAAT 5340 

AAAAAATGCA AG CACAC CTA ATATAACAAA TGTAATTACT GCAGATACAA ACCATTTATT 5400 

40 

TAAAACTAAG CAACAGAATA TTGTTAATAA AATCATTATT AATGTTGTGA TCCATAAATA 5460 

ATT AGG CAT A TCGAATAATG TCATATTCAT TCTCCTTTTA TTTCATTACT TTCCTTGTAT 5520 

ACATTTTATT ATAAATTTTT AAAAACTTAA ACAATAGCAG TCAGTTTCAA GCAATATTCT 5580 

ATCTACTAAT AGAAAAATCA TTGTTCCTTG CGACATGGAA ATCGTAACAT TATCGTTTAG 5640 

GAGAGAAAAT TATGTATAAT GAATGTATTA TACCAAAGGA GTGATTATAT GTCTCAAGGT 5700 

TTACCTTTAA GAGAAGATGT TCCTGTTTCA GAAACATGGG ATTTAGTAGA CTTATTTAAA 5760 

GATGATCAAC AATATTATGA AAGTATTGAC GCTCTAGTAC AnCAAGCAAA T CAATTT CAT 5820 
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GAAAATATTT TAATTGCCTT AGATCGCTTA AGTAATTATG . CAGAACTACG TTTAAGTGTA 5940 , 

GATACTAGTA ATATCGAGGC ACAAGTATTG AGCGCTAAAT TATCTACTAC ATACGGTAAJV .6000 ., 

ATTGTTAAGC CAATTATCCT TT 6022 
(2) INFORMATION FOR SEQ ID NO: 93: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 476 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 93 : 

CCATCAATAA TGTATACATG ATTGGCATCA TATTCCCCTT TAATTAGAGA GCTACGTACA 60 

GTTTGTyTTA TTAAAGTAGA ACTAATAAAT AACCATCTCT TATGTGCACA AACACTTCCC 120 

GCAACAATTG ATTCAGTTTT ACCAACCCGT GGCATACCTC TAATGCCAAT CAACTTATGA 180 

CCTTCTTCTT TGAACAATTC AGCTAAAAAG T CT ACT AACA AGCCTAAATC TTCACGCTCA 24 0 

AATCGAAAGG TTTTCTTATC TTTTGCATCT TGCTCAATAT ATCTTCCATG TCTTACTGCA 300 

AGAGGGTCTC TTAATTCTGG TTTTTTAAGC TTTGTTATTT CAATTTCATT TATACCACGA 360 
GCTATTTGCT CAAAACGTTC AACTTTTTCA AG ATTGTCTG TTTTAATTAA AAGGCCTCGT . 420 

TTACCTTGAT CAACACCATT AATTGTAACA ATACTTATAC CTAACATACC TAATAA 476 
(2) INFORMATION FOR SEQ ID NO: 94': 



(i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3633 base pairs 
35 (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
^ (D) TOPOLOGY: linear 



40 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 94 : 

AGAAATACAA CGAAGCATAT AAATATAACC GATCTTTTTT CTAATTGAAT ATTAAGTAAG 60 

TGTATGTACT TTCTGGAAGT AGCACCTAGT rGGATTGTtC CTCCTACAAC AGGCCAAAAA 120 

TTTTTATTTT TAACTGG CTT AACAGTGTTC AGTTTTTCAT ACTCTTCTCT ACTAATTTTG 180 

GCGCACCTTT TTGGAATGAA CCAATTAATA AATGGAAAAA AGTATACAAG CCAAGTTCTT 24 0 

ATTACATCGA CCATTAAATA CTCATCATCA TACTTAATAA CTCTGTATTT CGGATTTTTA 3 00 

TTGATAATTT CGGTTTCACA AAGCAATAAT TATCACTTCC TATTAATAAC AAATTCACAC 360 
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TTATATGACC TTAAATATAT AACATGAATC TTTTTGTCTA TTATTGAAGA CATATTTATA 4 80 

AAGAAAAATA GCATTGTCAT AATAACCCAA GGAATAAATA CTATAATATT TTGGATAGAT 540 

5 

AAACTAATCA rrACATCTAA GAACATGATT gATAATCCAC CACAGAAAAA ATAAGAAAAT 600 

AGTACAAAGC AAAGATTCTT GAATGATGGA AAAATCATAA TTTTTCCATT GCTACTCCGA 660 

TCATTATAGA TAGATAACTT TACTTTCTGA TTTAAATATA TATAAAACAC TAGAATACTT 720 

10 

AATAATAAAA CCGAACAAAT GATAATAACG CAATTTTTTT CTAAATGAGA ATCAGGTATA 780 

TATATTTTAT CTCTAAACAT AGTGCCAAAT AAAAGTATGC TACCTATAGC TGGCCATAAA 840 

15 GCTTTaTTTT TAACTGGTTT GACAATATTT AAATTATCAA AATCTTCTCT GCTGATTTGG 900 

ACATATTTTT TTGGTATTAA C CAATT AAT A AACGGAAAGA ACAAAACTAA CCAGGTGCTT 960 

ACTAAATCAA TCATCAGATA GTCGTTTTTA TATTTAATAA TTCTATATCT GGGATTTTTG 1020 

20 

TTTACAACTC TAACCTCGCA AAGCAATATC TCCACTTCCG TCTCGTTGGT TTTATATCTA 1080 

ATACACTTTC AGATACTTTA TAAGTGTTTT GTATTTTAGT AACATACTAT TTTCCTGTTT 1140 

ATTACTTAAC TTACGAACTA CAATCTAAGT TTAGTAATTT CTATTGCTTT TTAAGTTTGG 1200 

CATAAACCTT TTTATTACTA ATTGAGCCCA TG CTT ATT AG AAAGAAAAAA ATTGTAATAA 1260 

TAATCGACAT AATAAATACC AGTAGATTTT GAGGTTTTAT AGTCATTAGC CATATTAAAA 1320 

30 ATAATATAGA ACAACCTCCT AATAATAGAT ATGTGAAAAC TATAAAACTT CCATCTTTAA 13 80 

AAGTAGGCAC TAATATAACC CTATTTTCAT TATCTAGATT ATCATCATAT ATCTTTAGTT 1440 

TAAGCTTTTT ATTTAAGTAA ATGTAAAATG CTGCAATACC TATAAATGCT ATAAAACATA 1500 

55 AAGATATTAA AATCTTATTA TCTAATTGAA CTTCAAACGT ATGTACATAT TTCCGTAAAA 1560 

TAACTACAAA TAAAAACGAA CTACCAGTAA CTGGCCAGAA AATATTATTT TTATTTTGTT 1620 

TATCAACATT TAAATTTTCA AGTTCCTTCT CACTAAGTTT TGCATACCTT TTGGGAATGA 1680 

40 \ 

ACCAATTAAT AAAAGGAAAA AAGTATACAA GCCAAGTGCT TACTAAATCA ATTAACAAAT 174 0 

ACTCATCATT ATATTGAACG ACTTTATATC TCGGATTTTT ATTAATAACC TTAATATTAA 1800 

AAAGCAAAAC TCACCACGCC CATTTCATTG GATTTATATG ATTGCTAATA ATATTTTTAG 1860 

45 

CTTCACTAAC AGCATTCCCA ACACTATCCA TGGATTTTTC TGTAGTTTTT TTAACAACAT 1920 

CTATACTATT ATCGATTTTA TGCCCTACCC AGTCTACTTT ATCTTTTAAT CCAAAAATAT 1980 

SO TATTTTGATA AATTAAATCT GTTCCTAATG CAAATACTGT ACTCATAGCC AAACCTGCTA 2040 

AAATCACCCA TCCTACTGGA TTACTTCCTA AAACAAAAGT CGCTAATCCA GCTCCAACTG 2100 

CTGTCGCTGC AGATCCAGCT GCAAGCGTgC ATACCATTAT GCGACAACGC CTCTCCAAAT 2160 

55 



574 



EP O 786 519 A2 



CCTTTACCTA GGTATTTTCC GCCTTTTGCA AATTTACTAC CATTTTCTAT AAACACATTA 22 80 

CCTGATGTAC GTTTGACTTC CACAAATGAA TTTGGACCTG CTGGGCCTTT CACTCCACCT 2340 

5 GCTGTATTGa TAAATACACC GAATTTACTT GcATTTATAC CGTCTTGCTC TAAAAGTGTT 2400 

GACGTAATAT CTAATCCTAT ATCTCTTTTA ATACTGTCTT TATTGTCATT TATATATTTC 2460 

AATATACTTT TCGGGATATC GTCTTCTGGA TGTTCTTTGG CATATGCCTT TATAACAGCA 2520 

10 

AAGTCTGCTT TATTTAAAGT TTCTTTCTCT GCTTTATGTT CAATTTTCCC CATAGCAACT 2580 

TTCAAATATT TTTCATGACT TGCTTTGGCC CAATCAAGTT CTTTACCTGA AGGAATATTA 2640 

15 AATTGATTTG TTGAAAAGTT CCAAAAATTC TGCGCTTGGG TAAGTCCTTG TTGGACAATT 2700 

TTTTGAAATT CTTCAACTTC TTTAAATATT TCTGGTGATT TTTGATTAAA CTCACGCAAT 2760 

TTGCGTAGCT TCTCTTCTAA TTCATGTTTT TGTTGACCTA ATGTTCGTAT TATTTGTTGG 2820 

20 TTCGATGAAA TGGCTTGCTG ATTATCGGAA GCATGCTTTT TCAAATTGTT ATTCAAATTT 2880 

TCATATCGCG TAATTTGTTG ACTTAATGAT CTGATATCTT CTTCAAGCTC TGATTCTTTT 2940 

AAAGATATGC TATCAACCTC ACTCGTATAA CGTGACACAA AATTaTCGCA AGCTTGCTTC 3000 

25 

GTTAAATCAC TCAATGTTTT CATACTTGTT GATAATGGAA TTAACACCGT ACTAAAAAAT 3060 

TGCTTAGCTG ACGTATACGC TTTCCCTTTA AGCGCATCAT CATTAATAAA TTGAGTAATT 3120 

GCTTTTTCCA ACGCATCATA , ATTTGAATTC ATTGTTTGAC * TCAAATTCCC CACACTTGAA '3180 

30 

GCTTGGTTTC GAGATCTGTC TAAATACATG TCAATACTCA TCGGCATGCT CCTTTTTCAA 3 240 

AAATATATGA TTTTCAAACT ATTTAAAATC AAATGCTTTT TACATCTACA AAGTTGTAAA ~ 3300 

3S ATTTTAAAAC TCGGCGATGA TTATTTCTTA TGTAAAGGAG TCTAGATGCA GGTAAATTGA - 3 360 

GATAACATGT CGCCTTTTTT CTTATTTTAG CATATGGATA TAATGGTGTC TTTGTATATT 3420 

CGCAATTAAT GAATAAAAAT TATCTTTCAA TATTTTAATT TTATTGCGAC AACATCCTTA 34 80 

40 ' ACATTAAATA TATTAATATC TCAAAATATA TTCACTATTA AAATATGTCA TCAGTTGTTA 3 54 0 

AAAGTATTTC CTCATCATGC GAAATATCAA AACGTAT CTA AAATACGAAT AAGTTTATAC 3 6 00 

AATCACACAA CATCATCATT CAAAATTTTA TTG 3 633 

45 

(2) INFORMATION FOR SEQ ID NO: 95: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2 365 base pairs 

(B) TYPE: nucleic acid 
50 (C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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TGATACGAAt GCATTACAAT TCATATGCAA CATACAATTC CTTCTACAGC AAATGAAGTG 60 
AAACAAATAG TTGATGTGAC ATCTGTAGCA GAAAATGATA CGCATTAGTC ATAAAATTAA 120 
ATGGAAATGT CGATGAAGTG TATCAGCAAT TACAGCGATT AATTAAGAAT GCTAATGTCG 180 
AAGAGAGTGA GAATACTGAC AATATTAATA GTCAAGATAC AAGTTATACA CCTCAAGTAA 240 
AAGTAACAAC ACCAATTTTA GTGAAAGCAC CAATCGCTGG TCGTCGTATT TTACTTAAAG 300 
AAGTAAGAGA TTCAATTTTT AGAGAGAAAA TGGTAGGTGA AGGCTTAGCA ATCAAAGCTC 360 
ATGAAGAATC CAAAGTAATC GCACCGTTCA ATGGTTTAAT ATCTATGATT GTACCAACTA 420 
AGCATGCAGT TGGTATTCAA TCAGAAGACG GTGTGGACAT AGTCATTCAT ATTGGCGTGA 480 
ATACAGTTGA CTTGGAAGGT AAAGGGTTCA AGTGCTTTGT AAAGCAAAAT GATCATGTTG 540 
AAGCAGGGCA AACGTTGTTG CAATTCGACC AG CAAT AT AT ACAACAACAA GGCTACAATG 600 
CTGACGTTAT TGTCGTTATT AGCAACTCTG CCGATTTAGG AAAAGTAGAA CTGACAATGA 660 
ATGAAATCAT TACGACTGAA GATGTTATTT TTAAAATATT TAAAAACTAG GAGTGTGTTG 720 
TAATAATGAC AAAATTACCG CAAAATTTCA TGTGGGGTGG CGCTCTTGCC GCAAATCAAT 780 
TTGAAGGTGG ATATGATAAA GGTGGTAAAG GGTTAAGTGT AATTGATGTT ATGACGAGTG 84 0 

GTGCACATGG CAAAGCACGT CAGATTACAG AATCTATAGA TCCCAATCAC TATTATCCAA 900 - 

ATCATGAAGG TATTGATTTT TATCATCGTT ATAAGGAAGA TATTGCCTTG TTTAAAGAAA 960 

TGGGATTGAA ATGTTTACGT ACGTCGATTG CGTGGACACG TATCTTTCCG AATGGGGATG 1020 

AAGATGTGCC AAATGAAGAA GGACTCGCCT TTTATGATCG TATCTTTGAT GAATTAATTG 1080 
CACAAGGTAT TGAACCTGTT GTGACGTTAT CACATTTTGA GATGCCACTT CATTTAGCGA * 114 0 

AACATTATGG TGGATTTAGA AATAGAGAAG TTGTCGATTA TTTTGTGCAT TTTGCGCGTG 1200 

TTGTATTTGA AAGATATAAA GATAAAGTTA CATATTGGAT GACGTTTAAT GAAATTAATA 1260 . 

ATCAGATGGA CACATCAAAT CCTATCTTTT TATGGACGAA TTCTGGGGTA GCATTGACAG 132 0 

AAAATGATAA TCCTGAAGAA GTCyTGTATC AAGTAGCACA TCATGAACTT TTAGCCAGTG 1380 

CyTTAGCAGT TCGTCTTGGT AAAGaGATtA ATCCgAaGTT TAAGATTGGr ACmATGATTt 144 0 

CAmaTGTACC CmTTTATCCa TAwTCGTGTC ATCCGAAAGA TATGATGGAA GCACAAATTG 1500 

CGAATCGCTT ACGTTTCTTT TTCCCGGATG TCCAAGTGAG AGGTTATTAT CCAAGCTATG 156 0 

CTAAAAAAAT GTTGGCACGA AAAGGATATG ATGTTGGATG GCAAGAAGGG GACGACAGTA 162 0 

TTTTACAGCA GGGCACGGTT GATTATATTG GCTTTAGTTA TTACATGTCT ACGGCTGTAA 1680 

AACATGATGT TGATACTACA GTTGAAAACA ACATCGTCAA CGGTGGTTTG AATCATTCTG 174 0 
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GATATACATT 


GAATGTGTTA 


TATGATCGTT 


ATCAGTTACC 


ACTTTTTATT 


GTGGAAAATG 


1860 


GTTTTGGTGC 


AGTTGATGAA 


GTGGTAGATG 


GACATATTCa 


TGATGATTAT 


CGCATTGAAT 


1920 


ATTTAAAAGC 


ACATATTACA 


GCAGCGATAG 


AAGCAGTTGA 


TCAAGATGGT 


GTAGATTTAA 


1980 


TCGGTTATAC 


ACCGTGGGGA 


ATCATTGATA 


TTGTTTCATT 


TACAACCGGT 


GAAATGAAGA 


2040 


AACGCTATGG 


TTTAATATAT 


GTTGATCGAG 


ATAATGATGG 


TCATGGCACG 


ATGGAACGCT 


2100 


TGAAAAAAGA 


TTCGTTCTAT 


TGGTATCAAC 


AAGTGATAGC 


AT CAAATGGA 


GATAAATTAT 


2 160 


AAAGGTATAT 


TATAAGTATT 


TTAGGGTTAG 


AGCCCGAGAC 


ATAAATTAAT 


ATAGTAGGAC 


2220 


CTACAGTGTT 


ATAATGGCGG gCCCCCAACA CAAAGAATTT 


CGAAAAGAAA 


TTCtAcAGGT 


2280 


aATGCaAGtT 


GGCGGGGcCC 


AACACAGAGA 


AATTCGAAAA 


GAAATTCTAC 


AGGTAATGCA 


2340 


AGTTGGGGAA 


GGACAGAAAT 


AAATT 








2365 



20 (2) INFORMATION FOR SEQ ID NO: 96: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 11050 base pairs 
<B) TYPE: nucleic acid 
2S (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



30 



35 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 96: 

CTGCGATACG ATTTGTTGAA AGTGGGGAAA ACAAAAAAGT TATCATTACC AATTTAGAGC 60 

AGGCATACGA AG CTTTGATT GGTAATAAAG GTACACACAT TCACATGTAG ' CACTTTATCA 120 

CGCGACAAAA CATTAAATAT GTTTCTCCGT TGATTCAAAT GAAAAAGTTG TCTGCTGACA 180 

CTTTGCAAGG TTTGAAGGAG TTTAACTTAT GACAGAAAAC TTTATTTTGG GTAGAAATAA 240 

TAAATT AG AA CATGAACTAA AGGCATTAGC AGATTACATT AATATACCAT ATAGTATATT 300 

40 ACAACCATAT CAAAGTGAAT GTTTTGTCAG ACATTATACG AAAGGCCAAG TTATTTATTT, 360 

TTCGCCACAA GAAAGTAGCA ATATTTACTT TTTAATTGAA GGTAACATTA TTAGAGAACA 420 

TTACAATCAA AATGGAGATG TATATCGTTA TTTTAATAAA GAGCAAGTAT TATTTCCAAT 480 

CAGTAACTTA TTTCATCCGA AAGAGGTTAA CGAATTGTGT ACAGCATTAA CCGATTGTAC 540 

AGTTCTTGGA TTGCCTAGAG AATTGATGGC CTTTTTGTGC AAAGCTAATG ATGATATATT 600 

TTTGACACTT TTTGCATTAA TAAATGATAA TGAGCAGCAA CACATGAACT ATAACATGGC 660 

ATTAACAAGT AAATTTG CTA AAGATCGAAT TATCAAATTG ATATGCCATC TATGTCAGAC 720 

AGTAGGATAC GATCAAGATG AATTTTATGA AATCAAACAG TTTTTAACTA TTCAAC t CAT 780 
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TGAAAAACTT GTTGTTAAAG ATCATAAAAA TTGGTTAGTA AGCAAACATT TATTCAATGA 900 

TGTATGTGTT TAATATACAA TGTAAAATGA ATAAGTTGAA CATGAGGTCT AACGTACATT 960 

TATACGTTAG GCCTTTTTTG CTAGCATGAT GAATAATTTA AAATGTTAGT TAAATTTGAT- 1020 

TGTTGAAATT ACAGTAAAAT TTAAGGTGAT GAAAAATTTA GAACTTCTAA GTTTTTGAAA 1080 

AGTAAAAAAT TTGTAATAGT GTAAAAATAG TATATTGATT TTTGCTAGTT AACAGAaAAT 1140 

TTTAAGTTAT ATAAATAGGA AGAAAACAAA TTTTACGTAA TTTTTTTCGA AAAGCAATTG 1200 

ATATAATTCT TATTTCATTA TACAATTTAG ACTAATCTAG AAATTGAAAT GGAGTAATAT 1260 

TTTTGAAAAA AAGAATTGAT TATTTGTCGA ATAAGCAGAA TAAGTATTCG ATTAGACGTT 1320 

TTACAGTAGG TACCACATCA GTAATAGTAG GGGCAACTAT ACTATTTGGG ATAGGCAATC 1380 

ATCAAGCACA AGCTTCAGAA CAATCGAACG ATACAACGCA ATCTTCGAAA AATAATGCAA 1440 

GTGCAGATTC CGAAAAAAAC AATATGATAG AAACACCTCA ATTAAATACA ACGGCTAATG 1500 

ATACATCTGA TATTAGTGCA AACACAAACA GTGCGAATGT AGATAGCACA ACAAAACCAA 1560 

TGTCTACACA AACGAGCAAT ACCACTACAA CAGAGCCAGC TTGAACAAAT GAAACACCTC 1620 

AACCGACGGC AATTAAAAAT CAAGCAACTG CTGCAAAAAT GCAAGATCAA ACTGTTCCTC 1680 

AAGAAGCAAA TTCTCAAGTA GATAATAAAA CAACGAATGA TGCTAATAGC ATAGCAACAA 1740 

ACAGTGAGCT TAAAAATTCT CAAACATTAG ATTTACCACA ATCATCACCA CAAACGATTT 1800 

CCAATG CGCA AGGAACTAGT AAACCAAGTG TTAGAACGAG AGCTGTACGT AGTTTAGCTG 1860 

TTGCTGAACC GGTAGTAAAT GCTGCTGATG CTAAAGGTAC AAATGTAAAT GATAAAGTTA 1920 

CGGGAAGTAA TTTCAAGTTA GAAAAGACTA CATTTGACCC TAATCAAAGT GGTAACACAT 1980 

TTATGGCGGC AAATTTTACA GTGACAGATA AAGTGAAATC AGGGGATTAT TTTACAGCGA 204 0 

aGTTACCAGA TAGTTTAACT GGTAATGGAG ACGTGGATTA TTGTAATTCA AATAATACGA 2100 

TGCCAATTGC AGACATTAAA AGTACGAATG GCGATGTTGT AG CTAAAGCA ACATATGATA 2160, 

TCTTGACTAA GACGTATACA TTTGTCTTTA CAGATTATGT AAATAATAAA GAAAATATTA 2220 

ACGGACAATT TTCATTACCT TTATTTACAG ACCGAGCAAA GGCACCTAAA TCAGGAACAT 2280 

ATGATGCGAA TATTAATATT GCGGATGAAA TGTTTAATAA TAAAATTACT TATAACTATA 234 0 

GTTCGCCAAT TGCAGGAATT GATAAACCAA ATGGCGCGAA CATTTCTTCT CAAATTATTG 2400 

GTGTAGATAC AGCTTCAGGT CAAAACACAT ACAAGCAAAC AGTATTTGTT AACCCTAAGC 2460 

AACGAGTTTT AGGTAATACG TGGGTGTATA TTAAAGGCTA C CAAG AT AAA ATCGAAGAAA 2520 

GTAGCGGTAA AGTAAGTGCT ACAGATACAA AACTGAGAAT TTTTGAAGTG AATGATACAT 2580 
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50 



ACCAATTTAA 


AAATAGAATC 


TATTATGAGC 


ATCCAAATGT 


AGCTAGTATT 


AAATTTGGTG 


2700 


ATATTACTAA 


AACATATGTA 


GTATTAGTAG 


AAGGGCATTA 


CGACAATACA 


GGTAAGAACT 


2760 


TAAAAACTCA 


GGTTATTCAA 


GAAAATGTTG 


ATCCTGTAAC 


AAATAGAGAC 


TACAGTATTT 


2820 


TCGGTTGGAA 


TAATGAGAAT 


GTTGTACGTT 


ATGGTGGTGG 


AAGTGCTGAT 


GGTGATTCAG 


2880 


CAGTAAATCC 


GAAAGACCCA ACTCCAGGGC 


CGCCGGTTGA 


CCCAGAACCA 


AGTCCAGACC 


2940 


CAGAACCAGA 


ACCAACGCCA 


GATCCAGAAC 


CAAGTCCAGA 


CCCAGAACCG 


GAACCAAGCC 


3000 


CAGACCCGGA 


TCCGGATTCG 


GATTCAGACA GTGACTCAGG 


CTCAGACAGC 


GACTCAGGTT 


" 3060 


CAGATAGCGA 


CTCAGAATCA 


GATAGCGATT 


CGGATTCAGA 


CAGTGATTCA 


GATTCAGACA 


3120 


GCGACTCAGA 


ATCAGATAGC 


GACTCAGAAT 


CAGATAGTGA 


GTCAGATTCA 


GACAGTGACT 


3180 


CGGACTCAGA 


CAGTGATTCA 


GACTCAGATA 


GCGATTCAGA 


CTCAGATAGC 


GATTCAGACT 


3240 


CAGACAGCGA 


TTCAGATTCA 


GACAGCGACT 


CAGATTCAGA 


CAGCGACTCA 


GACTCAGATA 


3300 


GCGACTCAGA 


CTCAGACAGC 


GACTCAGATT 


CAGATAGCGA 


TTCAGACTCA 


GACAGCGACT 


3360 


CAGACTCAGA 


CAGCGACTCA 


GACTCAGATA 


GCGACTCAGA 


TTCAGATAGC 


GATTCAGACT 


3420 


CAGACAGCGA 


CTCAGATTCA 


GATAGCGATT 


CGGACTCAGA 


CAGCGATTCA 


GATTCAGACA 


34B0 


GCGACTCAGA 


CTCGGATAGC 


GATTCAGATT 


CAGATAGCGA 


TTCGGATTCA 


GACAGTGATT 


3540 


CAGATTCAGA 


CAGCGACTCA 


GACTCGGATA 


GCGACTCAGA CTCAGACAGC 


GATTCAGACT 


3600 


CAGATAGCGA 


CTCAGACTCG 


GATAGCGACT 


CGGATTCAGA 


TAGCGACTCA 


GACTCAGATA 


3660 


GTGACTCCGA 


TTCAAGAGTT 


ACACCACCAA 


ATAATGAACA 


GAAAGCACCA 


. TCAAATCCTA 


3720 


AAGGTGAAGT 


AAACCATTCT 


AATAAGGTAT ' 


CAAAACAACA 


CAAAACTGAT " GCTTTACCAG 


3780 


AAACAGGAGA 


TAAGAGCG AA 


AACACAAATG 


CAACTTTATT 


TGGTGCAATG 


ATGGCATTAT 


3840 


TAGGATCATT 


ACTATTGTTT 


AGAAAACGCA 


AGCAAGATCA 


TAAAGAAAAA 


GCGTAAATAC 


3900 


TTTTTTAGGC 


CGAATACATT 


TGTATTCGGT 


TTTTTTGTTG 


AAAATGATTT 


TAAAGTGAAT 


3960 


TGATTAAGCG 


TAAAATGTTG 


ATAAAGTAGA 


ATTAGAAAGG 


GGTCATGACG 


TATGGCTTAT 


4020 


ATTTCATTAA 


ACTATCATTC 


ACCAACAATT 


GGTATGCATC 


AAAATTTGAC 


AGTCATTTTA 


4080 


CCGGAAGATC 


AAAGCTTCTT 


TAATAGCGAT 


ACAACTGTTA 


AACCATTAAA 


AACTTTAATG 


4140 


TTGTTACATG 


GATTATCAAG 


TGATGAAACG 


ACATATATGA 


GATATACAAG 


CATAGAAAGG 


4200 


TATGCGAATG 


AACACAAATT 


AGCTGTGATT 


ATGCCCAATG 


TGGATCATAG 


CGCATATGCT 


4260 


AACATGGCAT 


ATGGTCATAG 


CTATTATGAT 


TATATTTTGG 


AAGTGTATGA 


TTATGTTCAT 


4320 


CAAATATTTC 


CACTTTCCAA 


AAAGCGTGAT 


GACAATTTTA 


TAG CAGGTCA 


CTCTATGGGA 


4380 
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TTATCTGCTG TGTTTGAAGC GCAAAATTTA ATGGATCTAG AGTGGAATGA TTTTTCAAAA 4500 

GAGGCCATAA TTGGCAATCT TTCAAGTGTT AAAGGAACTG AACATGATCC GTATTACTTG 4560 

CTAGACAAAG CTGTAGCTGA AGATAAACAA ATTCCAAAAT TGCTCATTAT GTGTGGTAAA 4620 

CAAGACTTTT TATATCAAGA CAACTTAGAT TTTATCGATT ATTTATCACG CATAAATGTT 4680 

CCTTATCAAT TTGAAGATGG ACCAGGAGAT CATGATTATG CATATTGGGA TCAAGCGATT 4740 

AAGCGTGCTA TAACATGGAT GGTGAATGAT TAATTATTTC TTGGAAAATA TGTGGCTGCA 4 800 

TTAAATACAC AGAGTGAGAG ATACAAACTA TTTACGCACG ACTAACATTT CTAAGTGTTT 4 860 

AAATTATTTT TGTATTAATA TGATTGGCGC AATTTGCTGA TACACAAAAA TGTTTCTCGT 4 920 

GAAACTTAGA TTTAGCTTAT AGTTTTATCA TCATTTGTAT GACTTACATT ATAAATTTTA 4980 

TTATAATGAG GTTAACGCTT TGAAAGGAGT CATCATCATG TCGACCAATA AAAACGATTA 5040 

TGAGCATATG TTGTTTTATT TTGCATATAA AACCTTTATT ACTACCGCTG ATGAAATTAT 5100 

AGAGAAGTAT GGTATGAGTC GTCAGCATCA TCGTTTTTTG TTTTTTATCA ATAAATTACC 5160 

TGGTATTACT ATTAAATCAT TACTAGAAAT ATTAGAAATT TCTAAmCAAG GATCACATGC 5220 

AACACTTCAA AAATTAAAAG AGCAAGGTCT CATTATTGAA AAAGTTTTAG AGACTGATCG 5280 

ACGTGTCAAA . AAATTATATT CGACGGATAA AGGCGATCAA CTCATTGCTG AATTGAACAA 5340 

GGCGCAAGAT GAATTATTGC AAAATATATA TCAAGAAGTC GGTTCGGATT GGTATGATGT 5400 

GATGGAAGCA TTGGCTAAAG GgCGACCTGG CTTTGATTTT ATTAAGCATT TGAAAGATGA 5460 

AAAAGAAAGC TAGCATCAGA AATGTTAAAA ATCTTCGCAT TCTTAAATTT AAAAAATATG 5520 

TCAAAAAGTG TATAATAAAA ACATATAATT TAATTGAACT CAGTTTCAAC AGATCTTAGA 5580 

AAGGAGTTTG AATGATGAAA AAATTAGCAG TTATTTTAAC ATTAGTTGGC GGTTTATACT 564 0 

TCGCATTTAA AAAATACCAA GAACGTGTTA ACCAAGCACC TAACATTGAG TACTAAATTA 5700 

AACCATAAAA AATTCCCGAA CACCTTGTTA TAGTGCTCGG GAATTTTTTT ATG CTTTACT 5760 

TGAATATATC AAATATTATT TTTGCGCTTT CTGTATTTTC GATATTACCA CTAAATGATT 5820 

CTGATCTAGG TCCGTAAGCG TAgGTATTAA CATCCTCGCC TGTATGTCCA TCGGAAGTCC 5880 

45 ACCCTGTATA AGATTTATCA TTTACTGGCT TCTGAATAGC GTGTTGTAGG GCTTTTGTTT 5940 

GCGTTTCTAG TTCTGCGGAT TTTTCGTCTT TTTCTTTTTT AAGTAGTCTT TTTAGCTTTT 6000 

TATTCT CTTT TTTAACCTTT TTCATATCAT CTTGTGAAAA TTCAAATCCA TAACCTTCAT 6060 

SO 

TAATAACTTT TTCAGGGTCT TCACCTTTAG CCATTTTTTC TGTCATATAT GATCCAGAGT 6120 

GTTTCATAGA TTTAATCGGT TGAGGATTCC ATTCGTATCC TTTATCTTTA CCAATTGTTA 6180 
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ATTGAATGGC GTCATCGAAT GCTTTTTCAA AACCTTCCAT TTCAGACATA ACGCCTGTAA 63 00 
TATCGTTGGA ATGCGCTGAT TTATCTATAG AAGCACCTTC GACCATTAAA AAGAATCCTT . 6360 

TTTTATTGCG CTCAAGCTTA CTAAGTGCAC TTTGTTGCAT ATCAGCTAAT GATGGTTCGT 6420 
CTTTAGAAGC ATCTATTGCA AGTGGCATAT TTTTATCTGG AAACAAACCA AGAACTTTAT ' 64 8 0 

CTTTATCAGA TTTTGATAAC TCCTTACTGT TCGTGGCAAG GTCGTAACCA TCTTTTTTGA 654 0 

ATTTTTTATC TAAATTGCCA TTACTTTTAC CGAAATATTT AGCGCCGCCG CCTAATAAAA 6600 

CATCAACTTT ATGCTTTCCG TTGATTTTAT CTTTATAAAA TTGTTTAGCG ATTTCGTTTT 6660 

TATCATCTCT AGAAGTCACG TGTGCAGCAT ATGCTGCTGG TGTTGCATCT GTTAATTCAG 6720 

CTGTTGAAAC AAGACCAGTC GACTTACCTT TTTCTTTTGC ACGTTCAAGC ACCGTCTTTA 6780 

CTTTCTGCTT GTTACTGTCA ACACCGATGG CACCATTATA TGTCTTATGA CCAGAACTAA 684 0 

20 AGGCTGTTCC GCCAGCTGCA GAATCAGTAA TATTCTGTTT TGGGTCATTT GAATATGTAC 6900 

GATTTGTGCC TTTTAAATAT GAATCAAAAG CAGTAGGGGT GATTTCTTTA GCATGCGGAT 6960 

CATTTTTATA ATAACGATAA GCTGTGTTAA ATGATGGACC CATGCCATCG CCAACTAAAA 7020 

26 AG ATAACATT TTTTGGATTT TTAGTATTAC CAACCGCGAA ACTTTCATCT TTAGAACTTT '7080 
TATCGGATTG CGCAATTGCA GGTGTGACAG AACTAAAAAC CGTTGACACG ATAATAAGGT : 7140 

TAGCAACTGC AAATTTTGTG GCTTTTTTAA CTGATAACAT AAGACATCCT CCTGAGTATA 7200 

30 

TGACTATGTC TTCAGTGTAA AAGAGGAATT . TtGAGCAATT ATGTAGTTTT AGTTAnAAAT " 72 60 

ATGTAAACAG AGTGATTTAG AATAACAAAA aATGAATATA TATGACAATT TGTTATAGAA 73 20 

AGCGTTAGAA TAGAAGCGTG TGAAAATATA GAATTAAATA TAATTTGAGG, TGGAAAAATG 73 80 

35 ' 

ATACTAGTAA TGTTATCTCC ATTATTAATC ATATTCTTTA ,TAGTGTTGTC TATTTTAGAA 744 0 

GAGCGTAAAC GTACGAAGAA AAAGCAACTC GAGAAAGAAA AAGCAAATAC ACTAAATCAA 7500 

40 AATACAAATG ACACGGAAAG TTCAAATCAA GAGCCGTGAT TGCAGCAGGA TAAAGAACAA 7560 

AAAGATAACA AAGGATAATT CAATTGAAGG AAGAAGATTA TAGATGAAAA TATTAATTGT 7620 

TGAAGATGAT TTTGTTATAG CAGAGAGTTT AGCATCTGAA CTTAAAAAAT GGAATTACGG 76 80 

TGTTATTGTC GTTGAACAAT- TTGATGATAT ACTGTCTATC TTTAACCAAA ATCAACCTCA 7740 

GCTTGTATTG CTAGATATTA ATTTGCCAAC GTTAAATGGT TTTCATTGGT GTCAAGAAAT 7800 

CCGAAAAACA TCTAATGTGC CAATTATATT TATTAGTTCC CGTATTGATA ATATGGACCA 7860 

AATTATGGCA ATACAAATGG GGGGAGATGA TTTTATCGAA AAGCCATTTA ACTTGTCATT 7920 

AACGATTGCC AAAATTCAAG CATTATTGAG ACGAACTTAT GACTTGTCAG TAGCTAATGA 7 980 ' 

55 



45 



50 



581 



10 



15 



EP0 786 519 A2 

ACAAAACATA CAGCTATCTT TGACTGAATT ACAAATATTA AAGTTATTAT TTCAAAATGA 8100 

AGaTAAATAT GTAAGTAGrA CTGCTTTAAT TGaAAAATGT TGGGaATCAG AAAACtTCAT 8160 

AGATGATAAC ACATTAGCTG TTAACATGAC GCGCCTGCTG AAAAAATTAA ATACTATTGG 822 0 

CGTTAATGAT TTTATCATTA CAAAGAAAAA TGTCGGATAT AAAGTATAGG GTGAATGCAA 8280 

TGAGCTTTCT TAAAAGTATT ACTCAGGAAA TAGCAATAGT CATAGTTATT TTTGCTTTGT 834 0 

TTGGCTTAAT GTTTTACCTG TATCATTTGC CATTAGAAGC ATATTTACTA GCACTTGGCG 8400 

TTATTTTATT ATTATTACTC ATATTCATAG GTATTAAATA TTTAAGTTTT GTAAAAACTA 8460 

TAAGCCAACA ACAACAAATT GAAAACTTAG AAAATGCGTT GTATCAGCTT AAAAATGAAC 8520 

AAATTGAATA TAAAAATGAT GTAGAGAGCT ACTTTTTAAC ATGGGTACAT CAAATGAAAA 8580 

CACCCATTAC TGCAGCACAA CTGTTACTTG AAAGAGATGA GCCTAATGTT GTTAATCGTG 864 0 

20 TTCGTCAAGA GGTTATTCAA ATTGaTAACT ATACAAGTTT AGCACTTAGT TATTTAAAGT 8700 

TATTAAATGA AACTTCTGaT ATTTCTGTCA CTAAAATTTC GATTAATAAT ATCATTCGCC 8760 

CAATTATTAT GAAATATTCA ATACAGTTTA TTGATCAAAA AACAAAAATC CATTATGAAC 8820 

25 CTTGTCATCA CGAAGTATTA ACTGACGTTA GATGGACCTC TTTAATGATA GAACAATTAA 8880 

TAAATAATGC ACTTAAGTAT GCGAGAGGTA AAG AT AT ATG GATTGAATTT GATGAGCAAT 894 0 

CCAATCAATT ACACGTAAAA GATAATGGTA TCGGTATTAG TGAAGCGrAC TTGCCTAAAA 9000 

30 

TATTTGATAA GGGCTATTCA GGTTATAATG GCCAGCGCGA AAGTAACTCA AGTGGG a TTG 906 0 

GTTTATTTAT CGTAAAACAA ATTTCAACAC ACACAAACCA TCCTGTTTCA GTCGTATCTA 9120 

AACAAAATGA G GG T A CAACA TTTACGATTC AATTTCCAGA TGAATAAAAA CTTTCAATAT 9180 

35 ■ 

TGTAAGTATA CTAGTAACAT TTTTTTACTA ATTTAAATGT TATTAGTATT TTTTTGTTTT 924 0 

AAT^TAGAAC TAACAAAGAA ATGAGGTGCA TGCCATGTTG CTAGAAGTGn AACATGTAAA 93 00 

40 AAAGGTTTAT GGTAAAGGTT TGAATGCTAC GACAGCACTT AATCAAATGA ATTTATCAGT 936 0 

TGGAG CTGGT GaATTTGTTG CaATTATGGG TGAGTCTGGG tCAGGGAAGT CTACACTACT 9420 

AAATTTAATT GCtTCTTTTG ATGGACTAAC TGAAGGTGAC ATTATTGTGG ATGGCGCACA 94 80 

TTTAAATAAT ATGAAAAATA AAAGTAAAGC ATTGTATCGT CaACAAATGG TAGGTTTTGT 954 0 

TTTTcAAGAT TTTAATCTTT TACCAACAAT GACGAATAAA GAAAATATAA TGATG CCATT 9600 

AATTTTAGCT GGTG CTAAAC GAAAAGATAT AGAACAAAGG GTACATCAGT TGGCAGTACA 9660 

ATTACATTTA GAGGGATTCT TAAACAAGTA TCCTTCTGAA ATCTCTGGGG GTCAGAAGCA 9720 

ACGCATTGCC ATTGCACGTG CATTAGTTAC TAAGCCGACG ATTTTACTAG CCGATGAACC 97 80 
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TCAATTGGAA 


CAGACAATTT 


TAATGGTAAC 


TCATTCAAAT 


ATCGATGCGT 


CTTATGCAGA 


9900 


GCGAGTCATT 


TTTATTAAAG 


ATGGGCGTCT 


ATATCATGAA ATATATCGTG 


GTGAAGAAAG 


9960 


TCAATTAGCT 


TTTCAACAAC 


GAATAACAGA 


TAGCTTAGCA 


CTTGTGAATG 


GAGGAAGTGT 


10020 


CAATATATGA 


AGTTAAGATT 


GTTATGnACA 


TAGTGCGACG 


TCAATTTATT 


ACGCAGCGAC 


10080 


TTGTAATCAT 


TCCATTCATT 


TTAGCGGTAA 


GTGTACTATT 


CATGATTGAA 


TATACGCTTG 


10140 


TGTCAATTGG 


GTTAAATAGC 


TACATAAAAC 


AGAAGAATGA 


CTTCCTAGTA 


C CATTT ATT A 


10200 


TCATAGCTAA 


ri-rrrriATG 


GCGCTTTTAA 


CTTTTATTTT 


TA1TTX-CTAT 


GCAAATCACT ~ 


10260 


TTATGATGTC 


ACAAAGACGA 


AAAGAGTTTA 


GCATTTTTAT 


GACATTGGGC 


ATGACCAAGA 


10320 


AAAGTATGCG 


TTTAATTGTA 


GTGATGGAAA 


CT AT CTTACA 


ATTTGTGATA 


ATTTGAGTCG 


10380 


TTAGTATTGC 


CGGCGGATAC 


TTACTTGGTG 


CGATATTTTT 


CTTGTTTATA 


CAGAAAATAA 


10440 


TGG6CAGTGA 


AGTTGCGACG 


TTAAGGTATT 


ATCCATTTGA 


CTCTGTAGCG 


ATGTTTATTA 


10500 


CTTTGATTAT 


CATTGCTGTA 


TTAATGGGCA 


TGGTACTTAT 


ATTCAACTTG 


TTTAGTATTA 


10560 


ATTTTCAACG 


GCCGATAACT 


TATCAACATC 


GTTCCGATTC 


TAGTGTCATA 


TCACGATGGT 


10620 


TGCGTTACGT 


TTTAATTGTT 


ATAGGAAGCG 


CAnACTATAT 


TTAGGTTACT 


TTATTGCATT 


10680 


ACAACAAGAT 


ACGACGTTTG 


GTGCCTTTTT 


TAAAATATGG 


ATTGTCATAG 


GATTAGTTAT 


10740 


TATCGGTACT 


TATGCATTTT 


TTGTAGGTAT 


AAGTGAAATA 


ATTATTAGTA 


TATTGCAGCA 


10800 


GGTATCAAAA 


GTTTACTATC 


ATCCACGGTA 


TTTTTTTGTG 


GTAGTTGGGA 


TGCGTGTACG 


10860 


TCTTAAAATG 


AATGCAGTCA 


GTCTTGCAAC 


AATCACTTTG 


CTGTGTACAT 


TTTTGATTGT 


10920 


AACGCTCACA 


ATGACATTAA 


CAACCTATCG 


TGATATGAAT 


CATACCATTA 


CGAAATTGAT 


10980 


TACGAATGAT 


TakGATTTGT 


CATTTAGCGA 


CAATTCTAAG 


TCACAAaTAG 


AACGTCAACA 


11040 


AACAATTGAG 












11050 



40 (2) INFORMATION FOR SEQ ID NO: 97: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 983 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
45 (D) TOPOLOGY: linear 

(xi> SEQUENCE DESCRIPTION: SEQ ID NO: 97: 

50 

CGACATAACG AGGCAAGGGT ACATGATACT TTAGCCTCGT TTTTGATATG TATTTTTCTG 60 

AATATAAGGG CAATAGATGG TATTTTATAw TTTTTTTAAG GTAGTGATTA ACATAGATAT 120 
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TCAAGCGGAA CAGCATTATG CACCAGTATT AACGCATTTT TTAGATCCAA GAGGGCAATA 240 

TATATTGGAA GTGATTTGTG GCAGTTATGA AGATTTAAAC GTATCTTTTT ATGGTGGACC 3 00 

TAATGCTGAA AGAAAAAGAG CAATCATTTC GCCGAACTAT TATGAACCTA AAGAAAGCGA 360 

CTTTGAATTA ACTTTAATGG AAATAGATTA TCCTGAAAAA TTCGTCACTT TAAAACATCA 420 

ACATATTTTA GGGACATTAA TGTCTTTAGG TATCGAACGC GAACAAGTTG GAGATATAAT 480 

TGTGaATGAA CGAATTCAAT TTGTTTTGAC AAGTAGATTG GAATCATTTA TTATGTTAGA 540 

ATTACAACGT ATTAAAGGCG CATCAGTTAA ACTTTATACT ATTCCAGTAA CAGATATGAT 600 

ACAATCTAAT GAGAATTGGA AAAATGAAAG TGCaCAGTTA GTTCTTTAAG GTTAGATGTT 660 

GTTATTAAAG AAATGATACG TAAATCACGT ACGATTGCGA AACAACTAAT CGAAAAAAAA 720 

CGTGTTAAAG TGAATCACAC TATTGTTGAT TCAGCAGATT TTCAATTACA AGCAAATGAt 780 

20 TTAATATCCA TCCAAGGTTT TGGTAGAGCA CACATTACTG ACTTAGGTGG TAAAACTAAA 840 

AAAGATAAAA CGCACATTAC CTATAGAACA TTATTCAAAT AGTAATGATT TAAGGAGGAT 900 

AACAAATGCC TTTTACACCA AATGAaATTA AGAATAAAGA GTTTTCACGT GTaAAGAATG 960 

25 GTTTTAGAAC CTACTGnAGT TGG 983 

(2) INFORMATION FOR SEQ ID NO: 98: 

" (i) SEQUENCE CHARACTERISTICS: 
30 (A) LENGTH: 10322 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

35 

" ' ixi) SEQUENCE DESCRIPTION: SEQ ID NO: 98: 

TTTTGCAAAG CTTATTTTAT GTCAAACAGA TAGTCAATGT GAAACAAAGG TTAGTACATA 60 

40 TAATCATCCA GACTTTATGT ATATATCAAC AACTGAGAAT GCAATTAAGA AAGAACAAGT 12 0 

TGAACAACTT GTGCGTCATA TCAATCAACT TCCTATAGAA AGCACAAATA AAGTGTACAT 180 

CATTGAAGAC TTTGAAAAGT TAACTGTTCA AGGGGAAAAC AGTATCTTGA AATTTCTTGA 240 

AGAACCACCG GACAATACGA TTGCTATTTT ATTGTCTACA AAACCTGAGC AAATTTTAGA 300 

CACAATCCAT TCAAGGTGTC AGCATGTATA TTTCAAGCCT ATTGATAAAG AAAAGTTTAT 360 

AAATAGATTA GTTGAACAAA ACATGTCTAA GCCAGTAGCT GAAATGATTA GTACTTATAC 420 

TACGCAAATA GATAATGCAA TGGCTTTAAA TGAAGAATTT GATTTATTAG CATTAAGGAA 480 

ATCAGTTATA CGTTGGTGTG AATTGTTGCT TACTAATAAG CCAATGGCAC TTATAGGTAT 54 0 
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GAATGGTTTC TTCGAAGATA TCATACATAC AAAGGTAAAT GTAGAGGATA AACAAAT ATA 6 60 

TAGTGATTTA AAAAATGATA TTGATCAATA TGCGCAAAAG TTGTCGTTTA ATCAATTAAT 720 

TTTGATGTTT GATCAACTGA CGGAAGCACA TAAGAAATTG AmTCAAAATG TAAATCCAAC 780 

GCTTGTATTT GAACAAATCG TAATTAAGGG TGTGAGTTAG ATGCCAAATG TAATAGGTGT 840 

TCAGTTTCAA AAAGCGGGAA AATTAGAATA TTATACACCT AATGATATAC AAGTAGATAT 900 

AGAAGACTGG GTAGTTGTCG AATCTAAAAG AGGCATAGAG ATAGGTATTG TTAAAAATCC 960 

ATTAATGGAT ATTG CTGAAG AGGATGTTGT GTTACCTCTT AAAAATATTA TTCGCATTGC 1020 

TGATGACAAA GATATTGATA AATTTAATTG TAATGAACGA GATGCTGAAA ATGCATTAAT 1080 

ACTATGTAAA GACATTGTAA GAGAACAAGG TTTGGACATG CGTTTAGTCA ATTGCGAATA 1140 

T ACATTAGAT AAATCGAAAG TTATTTTTAA TTTTACGGCG GATGATCGTA TTGATTTTAG 1200 

20 AAAATTAGTA AAAATATTAG CGCAACATTT AAAAACACGT ATCGAGTTGA GACAAATTGG 1260 

TGTAAGGGAT GAAGCCAAAT TGCTTGGCGG TATCGGACCT TGTGGTAGGT CGTTATGTTG 1320 

TTCTACATTT TTAGGGGATT TTGAACCAGT ATCGATTAAG ATGGCTAAGG ATCAAAATTT 1380 

25 

ATCATTAAAT CCAACTAAAA TTTCTGGTGC ATGTGGTCGT TTGATGTGTT GTTTAAAATA 1440 

TGAAAATGAC TATTATGAGG AAGTACGTGC ACAATTACCT GATATTGGTG, AAGCAATTGA ' 1500 

AACGCCTGAT GGTAACGGGA AAGTAGTTGC TTTAAATATA TTAGACATTT CTATGCAGGT. 1560 

30 

GAAGCTTG AG GGACATGAAC AGCCACTTGA ATATAAATTA GAAGAAATAG AAACTATGCA 1620 

TTAAGGAGGC ATTATTACAT TTGGATCGCA ATGAAATATT TGAAAAAATA ATGCGTTTAG 1680 

35 AAATGAATGT CAATCAACTT TCAAAGGAAA CTTCAGAATT AAAGGCACTT. . GCAGTTGAAT 1740 

TAGTAGAAGA AAATGTAGCG CTTCAACTTG AAAATGATAA TTTGAAAAAG GTGTTGGGCA 1800 

ATGATCAACC AACTACTATT GATACTGCGA ATTCAAAACC AGCAAAAGCT- GTGAAAAAGC 1860 

40 CATTACCAAG TAAAGATAAT TTGGCTATAT TGTATGGAGA AGGATTTCAT ATTTGTAAAG 1920 

GCGAATTATT TGGAAAACAT CGACATGGTG AAGATTGTCT GTTCTGTTTA GAAGTTTTAA 1980 

GTGATTAATC AAGCACACTC AAATAGTGTT ATAATTATAA ATGAATATGG TTTGGATAAG 2040 

TCTGAGACAA TGCATGTTTC AGGCTTTAAT TGTGTATAAA GTTTTGGTGA TTGCATAAGA 2100 

GATGGCGGTA CTAAATGTTA TTATTAAGTG TGCACGCAgT ATCaTTAGTT ATAAAATGTA 2160 

GCTGTTAAAA GTCAAAAATA CATCGAATGT AGTTAGGCAT ATAATATAAA AAGAGTTTTC 2220 

AATTACTCAA TAGAAAAAGG TTGTCTTCAT AGGAGTTAAA AATGTTAAAA GAGAATGAAC 2280 

GATTTGATCA ACTAATCAAA GAAGATTTTA GTATTATTCA AAATGATGAT GTTTTTTCAT 234 0 
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TGGACTTATG TTCAGGCAAT GGGGTGATAC CCTTGTTATT GTTTGCGAAA CATCCACGAC 24 60 

ATATAGAAGG TGTTGAGATT CAAAAAACAC TTGTCGATAT GGCGCGACGC ACATTTCAAT 2520 

TCAATGATGT TGATGAATAT TTAACAATGC ATCACATGGA TTTGAAAAAC GTTACTAAAG 2580 

TATTTAAACC TTCACAATAT ACTTTAGTAA CGTGTAATCC GCCTTATTTT AAAGAGAATC 2640 

AGCAACACCA ACATCAAAAA GAAG CACATA AGATAGCGAG ACATGAGATT ATGTGTACAC 2700 

TTGAAGATTG CATGATTGCA GCCCGTCATT TATTAAAAGA AGGTGGCAGG CTAAACATGG 2760 

TACATCGTGC AGAGAGACTA ATGGATGTCT TGTTTGAAAT GAGAAAAGTG AATATTGAAC 2820 

CTAAGAAAGT CGTTTTTATA TATAGTAAAG TAGGGAAATC AGCACAAACG ATAGTAGTAG 2880 

AAGGTCGAAA AGGTGGAAAT CAAGGTTTAG AAATCATGCC CCCATTTTAT ATTTATAATG 2940 

AAGATGGTAA TTATAGCGAA GAAATGAAGG AAGTATATTA TGGATAGTCA TTTTGTATAT 3000 

20 ATTGTAAAAT GTAGTGATGG AAGTTTATAT ACAGGATACG CTAAAGACGT TAATGCACGT 3060 

GTTGAAAAAC ATAACCGAGG TCAAGGAGCC AAATATACGA AAGTAAGACG TCCGGTGCAT 3120 

TTAGTTTATC AAGAAATGTA TGAGACAAAG TCTGAAGCAT TGAAGCGTGA ATATGAAATT 3180 

AAAACTTATA CCAGACAAAA GAAATTGCGA . TTAATTAAGG AGCGATAGTA TGGCTGTATT 3240 

ATATTTAGTG GGCACACCAA TTGGTAATTT AGCAGATATT ACTTATAGAG CAGTTGATGT 3300 

ATTGAAACGT GTTGATATGA TTGCTTGTGA AGACACTAGA GTAACTAGTA AACTGTGTAA 3360 

TCATTATGAT ATTCCAACTC CATTAAAGTC ATATCACGAA CATAACAAGG ATAAGCAGAC 3420 

TGCTTTTATC ATTGAACAGT TAGAATTAGG TCTTGACGTT GCGCTCGTAT CTGATGCTGG 3480 

ATTGCCCTTA ATTAGTGATC CTGGATACGA ATTAGTAGTG GCAGCCaGAG AAGCTAATAT 354 0 

TAAAGTAGAG ACTGTGCCTG GACCTAATGC TGGGCTGACG GCTTTGATGG CTAGTGGATT 3600 

ACCTTCATAT GTATATACAT TTTTAGGATT TTTGCCACGA AAAGAGAAAG AAAAAAGTGC 3660 

40 TGTATTAGAG CAACGTATGC ATGAAAATAG CACATTAATT ATATACGAAT CACCGCATCG 3720 

TGTGACAGAT ACATTAAAAA CAATTGCAAA GATAGATGCA ACACGACAAG TATCACTAGG 3780 

GCGTGAATTA ACTAAGAAGT TCGAACAAAT TGTAACTGAT GATGTAACAC AATTACAAGC 3 84 0 

ATTGATTCAG CAAGGCGATG TACCATTGAA AGGCGAATTC GTTATCTTAA TTGAAGGTGC 3900 

TAAAGCGAAC AATGAGATAT CGTGGTTTGA TGATTTATCT ATCAATGAGC ATGTTGATCA 3 960 

TT AT ATT CAA ACTTCACAGA TGAAACCAAA ACAAGCTATT AAAAAAGTTG CTGAAGAACG 4020 

ACAACTTAAA ACGAATGAAG TATATAATAT TTATCATCAA ATAAGTTAAT CACTTTATCG 4080 

ATTaTATGAA ATTTTAAACG ATTTTATAAA CGCAAGCTGT AATTTTAAAT GGTAAGTTAT 4140 
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GTTTTTTAAT GTAAAATAAA TACATTGAAA GTAATAAATA CCTTAACATT GAATAAGATG 4260 

AAAATGAGAT GACGAGATAA ATGTTCGCGT CCGTTGAAAT GCATAGAAAT CTTAGATATT 4320 

ATTTGAAGTG AGACATTACG AGGAGGAACA GTTATGGCTA AAGAAACATT TTATATAACA 4380 

ACCCCAATAT ACTATCCTAG TGGGAATTTA CATATAGGAC ATGCATATTC TACAGTGGCT 4440 

GGAGATGTTA TTGCAAGATA TAAGAGAATG CAAGGATATG ATGTTCGCTA TTTGACTGGA 4500 

ACGGATGAAC ACGGTCAAAA AATTCAAGAA AAAGCTCAAA AAGCTGGTAA GACAGAAATT 4560 

GAATATTTGG ATGAGATGAT TGCTGGAATT AAACAATTGT GGGCTAAGCT TGAAATTTCA 4620 

AATGATGATT TTATCAGAAC AACTGAAGAA CGTCATAAAC ATGTCGTTGA GCAAGTGTTT 4680 

GAACGTTTAT TAAAGCAAGG TGATATCTAT TTAGGTGAAT ATGAAGGTTG GTATTCTGTT 4740 

CCGGATGAAA CATACTATAC AGAGTCACAA TTAGTAGACC CACAATACGA AAACGGTAAA 4800 

20 ATTATTGGTG GCAAAAGTCC AGATTCTGGA CACGAAGTTG AACTAGTTAA AGAAGAAAGT 4 860 

T A TTTCTT T A ATATTAGTAA ATATACAGAC CGTTT ATT AG AGTTCTATGA CCAAAATCCA 4920 
GATTTTATAC AACCACCATC AAGAAAAAAT GAAATGATTA ACAACTTCAT TAAACCAGGA r 4980 

25 

CTTGCTGATT TAGCTGTTTC TCGTACATCA TTTAACTGGG GTGTCCATGT TCCGTCTAAT 5040 

: CCAAAACATG TTGTTTATGT TTGGATTGAT GCGTTAGTTA ACTATATTTC AGCATTAGGC 5100 

TATTTATCAG ATGATGAGTC ACTATTTAAC AAATACTGGC CAGCAGATAT TCATTTAATG 5160 

GCTAAGGAAA TTGTGCGATT CCACTCAATT ATTTGGCCTA TTTTATTGAT GG CATTAG AC 5220 
TTACCGTTAC CTAAAAAAGT CTTTGCACAT GGTTGGATTT . TGATGAAAGA TGGAAAAATG - -5280 

AGTAAATCTA AAGGTAATGT CGTAGACCCT AATATTTTAA TTGATCGCTA TGGTTTAGAT 4 5340 

GCTACACGTT ATTATCTAAT GCGTGAATTA CCATTTGGTT CAGATGGCGT ATTTACACCT 54 00 

GAAGCATTTG TTGAGCGTAC AAATTTCGAT CTAGCAAATG ACTTAGGTAA CTTAGTAAAC 5460 

40 CGTACGATTT CTATGGTTAA TAAGTACTTT GATGGCGAAT TACCAGCGTA TCAAGGTCCA 5520 

CTTCATGAAT TAGATGAAGA AATGGAAGCT ATGGCTTTAG AAACAGTGAA AAGCTACACT 5580 

GAAAGCATGG AAAGTTTGCA ATTTTCTGTG GCATTATCTA CGGTATGGAA GTTTATTAGT 5640 

AGAACGAATA AGTATATTGA CGAAACAACG CCTTGGGTAT TAGCTAAGGA CGATAGCCAA 5700 

AAAGATATGT TAGGCAATGT AATGGCTCAC TTAGTTGAAA ATATTCGTTA TGCAGCTGTA 5760 

TTATTACGTC CATTCTTAAC ACATGCGCCG AAAGAGATTT TTGAACAATT GAACATTAAC 5820 

AATCCTCAAT TTATGGAATT TAGTAGTTTA GAGCAATATG GTGTGCTTAA TGAGTCAATT 5880 

ATGGTTACTG GGCAACCTAA ACCTATTTTC CCAAGATTGG ATAGCGAcGG AnAATTGCAT 594 0 

55 



30 



35 



45 



50 



587 



EP0 786 519 A2 



AACCTCAAAT TGATATTAAA GACTTTGATA 
ATGCTGAACA TGTTAAGAAG TCAGATAAGC 
5 AACAAAGACA AATTGTATCA GG AATTG CCA 

AAAAAGTAGC AGTTGTTACT AACCTGAAAC 
GTATGATATT ATCTGCTGAA AAAGATGGTG 

10 

TTCCAAATGG TGCAGTGATT AAATAACTGT 
TAATCGATAC ACATGTCCAT TTAAATGATG 

1S TTACACGTGC TAGAGAAGCA GGTGTTGATC 

CAATTGAACG CGCGATGAAA TTAATCGATG 
GGCATCCAGT TGACGCAATT GATTTTACAG 

20 CTCAGCATCC AAAAGTGATT GGTATTGGTG 

CTCCTGCAGA TGTTCAAAAG GAAGTTTTTA 
AGTTACCAAT TATCATTCAT AACCGTGAAG 

25 

AGGAGCATGC TGAAGAGGTA GGCGGGATTA 
CAGATATTGT AACTAATAAG CTGAATTTTT 
AAAATGCTAA ACAGCCTAAA GAAGTTG CTA 

30 

AAACCGATGC ACCGTATCTT TCGCCACATC 
GAGTAACTTT AGTAGCTGAA CAAATTGCTG 

35 GCGAACAAAC AACTAAAAAT GCAGAGAAAT 

GAGAAAGATC ACCGCCATAA ATGTAAACGA 
TTCTCACTTT TTTAAATTAA AATATCGTGC 

40 AGCTTTGAAA TTAAGAATTG TAGGAAGGCG 

GTAGAAGGAC GAGATGATAC TGAGCGTGTT 
ACGAATGGTA GTGCCATCAA CGAACAAACT 

45 

CGAGGCGTTA TTGTATTAAC AGATCCAGAT 
ACTGAACATG TCAAAGGTGT TAAACATGCG 
AAAGGGAAAA TTGGTGTTGA ACATGCCGAC 

50 

GTTAGTTCAC CCTTTGATGA AGCTTATGAA 
GGGTTAATTG TTGGGAAAGA TGCAAGGCGC 
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AAGTTGAAAT TAAGGCAGCA ACGATTATTG -6060 

TTTTAAAAAT TCAAGTAGAC TTAGATTCTG 6120 

AATTCTATAC ACCAGATGAT ATTATTGGTA 6180 

CAGCTAAATT AATGGGACAA AAATCTGAAG 6240 

TATTAACCTT AGTAAGTTTA CCAAGTGCAA 6300 

ATTTTTAAAA ATTAGGAGAG ATAATTATGT 6360 

AG CAATACGA TGATGATTTG AGTGAAGTGA 6420 

GTATGTTTGT AGTTGGTTTT AACAAATCGA 6480 

AGTATGATTT TTTATATGGC ATTATCGGTT 6540 
AAGAACACTT GGAATGGATT GAATCTTTAG % 6600 

AAATGGGATT AGATTATCAC TGGGATAAAT 6660 

GAAAGCAAAT TGCTTTAGCT AAGCGTTTGA 6720 

CAACTCAAGA CTGTATCGAT ATCTTATTGG 6780 

TGCATAGCTT TAGTGGTTCT CCAGAAATTG 6840 

ATATTTCATT AGGTGGACCT GTGACATTTA 6900 

AGCATGTGTC AATGGAGCGT TTGCTAGTTG 6960 

CGTATAGAGG GAAGCGAAAT GAACCGGCGA 7020 

AATTAAAAGG CTTATCTTAT GAAGAAGTGT 7080 

TGTTTAATTT AAATTCATAA AGTTAAAAGT 7140 

TGCTATATTC GTTTAATATG CTATGGTTCT 7200 

ATGTGGAATA CGTGCGATAG AGATGGTTAG 7260 

TTTTAAATGA AAATCAATGA GTTTATAGTT 7320 

AAACGAGCTG TTGAATGTGA TACGATTGAA 7380 

TTAGAAGTAA TTAGAAATGC TCAACAAAGT 7440 

TTCCCAGGAG ATAAAATTAG AAGTACAATT 7500 

TATATTGATA GAGAAAAAGC TAAAAATAAA 7560 

TTAATTGATA TTAAAGAAGC GTTAATGCAT 7620 

TCAATTGATA AATCTGTGCT AATAGAGTTG 7680 

CGTAGAGAAA TTTTAAGTAG AAAATTGCGA 7740 
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GCGGATGTAA GGCAAGCTTT AGAAGATGAA TGAGGAAGTG AAAATGTTGG ATAATAAAGA 7860 

TATTGCAACA CCATCAAGAA CGCGAGCGTT GTTAGATAAA TATGGCTTTA ATTTTAAAAA 7920 

AAGTTTAGGA CAGAACTTTT TGATAGATGT GAATATCATT AATAATATCA TTGATGCAAG 7980 

TGATATTGAT GCACAAACTG GGGTGATTGA AATTGGTCCA GGCATGGGGT CATTGACAGA 8040 

ACAATTGGCC AGACATGCTA AAAGAGTATT GGCATTTGAA ATTGATCAAC GTTTAATACC 8100 
TGTATTAAAT GATACACTAT CACCTTATGA TAATGTGACG GTGATTAATG AAGATATTTT ' 8160 

AAAAGCGAAT ATTAAAGAAG CTGTTGAAAA TCATTTACAA GATTGTGAAA AAATAATGGT 8220 

TGTTGCAAAC CTGCCGTACT ATATTACGAC GCCAATTTTA TTAAATTTGA TGCAACAAGA 8280 

TATACCAATT GATGGCTACG TGGTGATGAT GCAAAAAGAA GTGGGCGAAC GCTTAAATGC 8340 

TGAAGTAGGT TCAAAAGCAT ATGGTTCGTT ATCAATTGTC GTACAATACT ATACAGAGAC 8400 

TAGTAAAGTA TTAACGGTAC CTAAATCTGT ATTTATGCCA CCACCTAATG TTGATTCAAT 8460 

AGTTGTAAAA CTGATGCAGA GAACTGAACC GTTAGTAACA GTAGATAACG AGGAAGCATT - 8520 

C TTTAAGTTA GCAAAAGCAG CATTTGCACA AAGAAGAAAG ACAATTAACA ATAACTATCA 8580 

AAATTATTTT AAAGATGGTA AACAACACAA AGAAGTGATT TTACAATGGT TGGAACAAGC 8640 

AGGTATTGAT CCAAGACGTC GCGGTGAAAC GCTATCTATT CAAGATTTTG CTAAATTGTA 8700 

TGAAGAAAAG AAAAAATTCC CTCAATTAGA AAATTAAATG ATTGACAAAG CAAAGCACTA 8760 

TTGTTAAAAT TTAAATTTTG TTTGACGAAA ACGTTGCAAA TATGGTATTA TGTAACTTGT 8820 

AGCGAGGTGG AGCAATATGC CAAAATCAAT TTTGGACATC AAAAATTCTA TTGATTGTCA 8880 

35 TGTAGGAAAT CGTATTGTAC TGAAaGCCAA TGGAGGCCGT AAGAaAACAA TAAAACGTTC 8940 

TGGAATTTTA AAAGAAACAT ATCCGTCAGT TTTCATTGTT GAGTTAGATC AAGACAAACA 9000 

CAACSPTTGAG AGAGTATCTT ATACATACAC TGATGTGTTA ACTGaAAATG TTCAAGTTTC 9060 

40 ATTTGAAGAG GATAATCATC ACGAATCAAT TGCACACTAA ATAAGACATA TAGAGATGTT 9120 

AGACGTTTCT TAGTATAAGA AGTAAATATT ATGATAATTA TTTGAGTGTT GGGcATTATG 9180 

TTCAATACTC TTTTTATTTA CAAAATGTTT AACACTGATG TTTCGCTTAT AGATTTTTCA 9240 

GTAAATGGAT AATTGTATTT ATAAACACAA ATACAAGTAA ATACTAAGTA ATTAGATGGA 93 00 

GAAAATTACT TTTTTATTAA AAAAACACTA AAAAACAAAT TAAAATGTCA AATATTAATT 9360 

CTCTTTATGT TAAAATCATC ATATTAAGAT AACGAAAAGA GGGCGGAAAA TGATATATGA 9420 

AACGGCACCA GCCAAAATTA ATTTTACGCT CGATACACTT TTTAAAAGAA ATGATGGCTA 9480 

TCATGAGATT GAAATGATAA TGACAACAGT TGATTTAAAT GATCGTTTAA CTTTTCATAA 9540 
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AAATCTCGCA TATCGTG CAG CGCAACTATT TATTGAGCAA TATCAACTAA AG CAAGGTGT ^SSO 

AACAATTTCT ATCGATAAAG AAATACCTGT TTCTGCTGGC TTAGCTGGAG GTTCGGCTGA 9720 

TGCAGCAGCA ACGTTAAGAG GATTGAATCG ACTTTTTGAT ATAGGGGCGA GTTTGGAAGA 9780 

ATTGGCTCTA CTAGGCAGTA AAATCGGGAC AGATATTCCG TTTTGTATTT ATAATAAAAC 9840 

TGCACTATGT ACTGGAAGAG GAGAGAAAAT CGAGTTTTTA AATAAACCAC CTTCAGCTTG 9900 

GGTGATTCTT GCTAAACCAA ACTTAGGCAT ATCATCACCA GATATATTTA AGTTGATTAA 9960 

TTTAGATAAG CGTTACGACG TACATACGAA AATGTGTTAT GAGGCCTTAG AAAATCGAGA 10020 

TTATCAACAA TTATGTCAAA GTTTGTCTAA TCGATTAGAG CCAATTTCTG TTTCAAAACA 10080 

CCCACAAATC GATAAATTAA AAAATAATAT GTTGAAAAGT GGTGCAGATG GTGCGTTAAT 10140 

GAGTGGAAGC GGACCTACTG TGTATGGGCT AGCACGAAAA GAAAGCCAAG CAAAAAATAT 10200 

TTATAATGCA GTTAACGGTT GTTGTAATGA AGTGTACTTA GTTAGACTAT TAGGATAGAA 10260 

GGGTTGAAAA GATGAGATAT AAACGAAGCG AGAGAATTGT TTTTATGACG CAATATTTGA 10320 

TG 10322 

(2) .INFORMATION FOR SEQ ID NO: 99: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5614 base pairs 
: (B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 
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,- (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 99: 

GATTGATTAA ATGTTTTAAT CCACTTCAAT GCCTTCGATA AACTCTACAA TCGCGCTATT 60 

CATATAATTA TTCGATTTCA TTTGTTCAGC ATATGTCTCA TTAAATCCAG ACATAACTTT 120 

TTTAAAwGCG AAAATTGAAA TTGGTATCGT TACTAATAAG GCACTAG CCA TACGCCAATC 180 

AATGAGCATT ATGTATAAAA AG AT AG CAG C TGACAAAAGT AAGTTTCCTA TAACTTCAGG 24 0 

AATCATATGT GCTAAAGGTA ATTCTATTGT TTCAACCTTA TCGACAAATA TATTTTTTAA 300 

TTCACCTATT TTCTTAGATT CCaCTACGCC TAAAGGGAGA CGCATTAATT TTTGAGCTAA 360 

TTTTTTACGA ATTTCAGATA AAATTTCATA TGCCGTAATA TGTGATAGCA TCGTTGACGC 420 

TCCAAAACAA CACACTTGTG AAATATAAGC GATTAAAGCA ATAAAGATAT AAACCATAAT 4 80 

CGAATTAATC GTATATGTAT TGTTAATCAT CATTAAAATA ATTTTAAATA CTGCCCAATA 54 0 

AGGAACTAAT CCAGAAAAGA CACTGATGAT AGACAACAAA ATTGATAACA TAATTTTCCA 600 
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ATATGTAACT CCTkTCAATT AATAATCTAA ATTAAGCCGC TTATATTATT TATTTCACTG 720 

GATGATATAC ATAATATAAA TTTGTTATTT GTTAAAAATT AATACTTATT ACAAGTACAT 780 

CATATATTAG TTGATAACGA TTATCAATGT CGCGTGGATT TGTGACACAT TTCTTTTAAA 84 0 

AATTCACAAG GTTATGGGGC AGAAATGATA AAGAGCCACT AATGATTTAT TATGTAGTGG 900 

TTCTGGGAGT GGGACAGAAA TGATATTTTC ACAAAATTTA TTTCGTCGTC CCACCCCAAC 960 

TTGCATTGTC TCTAGAAATT GGGAATCCAA TTTCTCTTTG TTGGGTCCCT GAATATAGCC * 1020 

TTGTAGAGTC TAGTACATTG ATTTGTATCC CAATGTCCCT ATAATTGATT ATTCGCTTTA 1080 

1S TCTAATGATC CTATGACTCA ACTATTAAAT CATTTTTCGA AATACTTAAT TCTAATATAA 1140 

TTAAATTCAT TTATTGTAAT ATTGCAAAAA TACATTGCAC ACCTTGTTCA TCAATGCTAT 1200 

AATTAATTAC ATAATAAATT GAACATCTAA ATACACCAAA TCCCCTCACT ACTGCCATAG 1260 

20 TGAGGGGATT TATTTAGGTG TTGGTTATTT GTCACCTTTT TTATTGTTGC GCGTTCGTAA 1320 

CCAATGTGCA AAAAACGCAA CAAGACAGCC GCTTATAGCT GAAGTCATGA TGTTAATTAA 1380 

TAAATTGAAC ATCCGTCATA CACCTCCTCT CTGCGTTAAA GTAACGCCCG AGATGTTAGG 1440 

25 

CGACCATCAT ATTATATCAT TTATTTATTA TATTTCACGC AATATTAAGG CTTAAGTAAA 1500 

GTTTTTTTTA GTGGTTTACG CTACTTTAAT TGCTATCTTT TAAAATCCAT TTAGATAATA 1560 

TAAATGTGAT GGGTATCGTA ATAATTAAAC CAGCAAATGG TGCAATTTCT GCTGGCAAAT 1620 

TTAGCCAGGA TACAAATACA TATAATAAAA CTGTTTGTAA GCTTACGTTG ACAATCTGCG 1680 

TAATTGGAAA ACTAATGAAT TTTCTCCAAG TAGGTTTTAC CCTGTAAACA AAATAACAAT 1740 

TCAAATAATA TGAAATCACA AAAGCGACTA GAAATCCGGT AATATGACTA ATCATATATT 1800 

CAATGTGTAA TAATTTTAAC AGCAATAAAT AGACAACATA . ATAATTTAAG GTATTAATGC 1860 

CGCCAACAAT GATAAATTTT AAAATTTCAG CATGCGTTTG TGTTAGTTTC ATATGTGTAC 192 0 

40 TCCTCAACAT CAAAATATAT GCATAACTAC GTTCTCGAAC ATACTCGAAT ATGCGAGCCA 1980 

ATCCGCTTCA CTTCAAATAT GCTTATTTCA ATCTTTATAC CCTTTCACAG CAAATTTAGT 2040 

CTCTTTCCCC TCATCCTTAT ACGCCATTAT AATGTAACTG ATTTATCGCG TGACTCATTA 2100 

45 . " . 

GCACTATAGA GATTACTTTA GTTCACTAGT AATTTTATAT ACAATAAGAG CGACAACAGT 2160 

AATGAGAGGA TGTCTACTAT GCAATTACAA AAAATTGTCA TCGCTCCTGA CTCATTTAAG 2220 

GAAAGTATGA CCGCACAGCA AGTTGGCAAT ATTATAAAAC AGGCTTTTAC TAATGTTTAT 22 80 

SO 

GGGAATACCC TTCATTATGA TATCATTCCG ATGGCTGATG GTGGTGAAGG TACCACAGAT 234 0 

GCTTTAATGC ATGCAACAGG TGCCACTAAG TATACAGTCA TCGTTAATGA CCCTTTAATG 24 00 
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GCGGCAGCGT CAGGTTTGGA TTTATTAGAA AAAGAGGAAC GTAATCCTTT ATACACATCA 2520 
TCATATGGTA CCGGTGAACT AATTAAAGAT GCATTAAATC ATGGTGCTAA GACCATTATT \ 2580 

TTAGGGATTG GTGGCAGTGC AACAAATGAT GGTGGTACAG GTATGCTAAG TGCACTAGGC 2640 
GTAAAGTTTA CTGATGTAAA CGGGGACTTA TTACAAATGA ATGGTGCTAA TCTTGCTCAC ' 2700 

ATTGGACAAA TCGATATAAC CAATCTAGAT TCGCGATTAA AAGAGGTGAC CTTTAAAGTG 2760 

GCCTGTGATG TTTCAAATCC TTTATTGGGT GAAAATGGTG CTACCTATAT TTATGGTCCT 2820 

CAAAAAGGCG CTGATGCAAA GATGATACCA AAGTTGGATT TCGCAATGTC GCATTATCAT 2880 

GATAAGATAA AAATGTGCAC AGGAAAGTCC GTTAATCAAA TACCAGGTTC TGGTGCAGCT 294 0 

GGCGGTATGG GCGCAG CATT ATTAGCGTTT TGTGAGACAA CTTTAACAAA AGGTATTGAT 3 000 

GTCGTCTTTG ACATTACAGA TTTTCATCAA AGAATTAAAG ATGCAGACCT CGTTATTACT 3060 

GGAGAAGGAC GCATGGATTA TCAGACCATC TTTGGTAAAA CACCCGTAGG CGTTGCGTTA 3120 

GCTGCAAAAC AATATCATAT TCGTGTCATC GCGATTTGTG GCAGTCTAGG CGAAAATTAT ,3X80 

CAACATGTTT ACGATTTCGG TATTGATAGT GCCTATTCTA TAATCTCTTC ACCTAGCACT 324 0 

25 TTAGAAGATG TCCTACAAAA TAGCGAACAA AATTTATTAA ACACTGCAAC TGACATTGCT 3300 

CGTATTCTGA AATTACAATA ATGTCAAAGT AAATCATGAG CTTTATTATT TGCAGTTAAA 3360 

. ACTTGAATGA GGTGAAACCC ATGAAAAGAA CTGATAAATA CCGTGATTCA TATCAATACG 3420 

ACAATCAAAA CCAAAATCAT CGTCGTCAAT CTGAAGACGC ATCGTATAGA CAACAATATG 34 80 

- CTAAAGGGGA TCCTGAAGAA CACCCGGAAC GATACTATAA TGGTAGAGAT TATCGAAGAG 354 0 

- AACAAATTCT TGAAGAAGAA AACGAGAAAT CCCGCCGTTC AAAAAAATGG TTATATATCA 3600 
v TTATTGCCAT TCTCTTAATT ATTGTCGCTA TTTTTGTCAC ACX3CG CCTTA CTTAACAATG 366 0 

ATAGCGATAA AGTTAGTAAT GACCCTAAAG TCTCTCAAAA TTATAAAAAA CAAGTTGAAA 3720 

ATCAAGACGG CCAAATTAAC CAGCAAGTAG ATAATGCTAA AGAAAATATT AAAAACAACC 3780 

AAAAAACTGA TGACATTATT AAAAATTTAC AAAATCAAAT CGACAACTTG AAGCAGCAAG 3840 

AACAAAACAA AGCTGATTCT AAGCTAACTC AATTTTATCA AGACCAAATC AACAAATTGA 3900 

45 CAGAGGCAAA TAATGCACTT AAAAACAATG CAAGCCAAGG TAAAATTGAA AGCATGTTAA 3960 

ATGATATTAA TACAAAATTC G ACAG T ATT A AATCTAAATT AGAAAGCTTA TTTAAAGATG 4020 

ACAATGGTGG CGCTAATTAA TTATTACACC TGCTTTGATG ATAAACATTA ATTCCCTATA 4080 

60 CTTTATCTGT ATCACTACGT TATTCGTGAT GATGCATTAA GAGTATAGGG ATTTTTTATA 4140 

TAAACTTGTA TTCTAACTAC ATACAAATAC ACACAAAACG TATATAATTT ATATAATTAT 4200 
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TTATTGCTAA 


TTACGTTAGG 


CGTCATGACC 


GCTTTTGGCC 


CACTAACTAT 


AGATATGTAC 


4320 


GTACCATCAT 


TACCTAAAGT 


GCAAGGTGAT 


TTTGGTTGTA 


CTACATCAGA AATTCAATTA 


4380 


ACATTATCAT 


TCACAATGAT 


TGGTCTTGCA 


CTAGGCCAAT 


TTATCTTTGG 


ACCTTTATCC 


. 4440 


GATG CTTTTG 


GTCGCAAACG 


GATTGCTGTA 


TCCATTTTGA 


TCATTTTCAT 


TTTGGTATCA 


4500 


GGTTTGTCTA 


TGTTTGTTGA 


TGAATTGCCA 


TTATTCTTAA 


CTTTACGATT 


TATTGAAGGT 


4550 


TTAACTGGTG 


GTGGCGTCAT 


CGTGATTGCA 


AAAGCCTCTG 


CTGGTGATAA 


ATTTAGTGGC 


4620 


AACGCACTCG 


CTAAATTTTT 


AGCATCTTTA' 


ATGGTAGTTA ATGGCATCAT 


CACTATTCTT • 


4680 


GCACCATTAG 


CCGGTGGATT 


AGCTTTATCC 


GTAGGAACAT 


GGCGTTCTAT 


TTTCACAATT 


4740 


TTAACTATTG 


TGGCACTCAT 


CATTTTAATT 


GGCGTCGCTT 


CTCAATTACC 


TAAAACATCT 


4800 


AAAGATGAAT 


TAAAGCAGGT 


GAATTTTAGT 


AGCGTCATTA 


AAGATTTTGG 


AAGTCTTTTG 


4860 


AAAAAACCAG 


CATTTATTAT 


TCCAATGCTA 


TTACAAGGwT TAACTTATGT 


AATGCTATTT 


4920 


AGTTATTCAT 


CTGCATCGCC 


ATTTATTACT 


CAAAAATTGT 


ATAATATGAC 


ACCCCAACAA 


4980 


TTTAGTATCA 


TGTTTGCTGT 


TAACGGTGTA 


GGTTTAATCA 


TTGTCAGTCA 


AGTCGTTGCT 


5040 


TTATTAGTAG 


AAAAATTACA 


TCGCCACATA 


TTATTAATCA 


TTTTAACTAT 


TATACAAGTG 


5100 


GTAGGTGTTG 


CTTTAATTAT 


GCTGACACTT 


ACATTCCATT 


T AC CACTTTG 


GGTCTTACTC 


5160 


ATCGCATTCT 


TCTTAAATGT 


GTGTCCTGTG 


ACGTCAATTG 


GACCGCTTGG 


TTTCACAATG 


5220 


GCTATGGAAG 


AACGAACAGG 


TGGCAGTGGT 


AACGCATGAA 


: GTTTACTTGG 


CTTATTCCAA 


:52B0 


TTTATCTTAG 


GTGGCGCTGT 


TGCACCATTA 


GTTGGCTTAA 


AAGGCGAATT 


TAATACATCA 


5340 


CCATATATGA 


TTATTATCTT 


CATTACAGCC 


ATTCTATTAG 


TCAGTCTACA 


AATCATTTAC 


5400 


TTTAAAATGA 


TTAAAAAGCA 


ACATGTCGCA 


TAACACTTCA 


ACATAATTAG AACCCTAGCA 


5460 


AAGA^ATCTA 


TCTTTGTCAG 


GGTTCTTCTT 


TATGAATTAT 


GAGATCGAAT 


CTTCAACTAA 


5520 


AATTACGCCT 


TCATAGCAAG 


GACATTTCTA 


TTCAATCACC 


CTTTAACAGG 


CATCCAAATT 


5580 


TcTGTAATAT 


ATTTTTGACT 


TGTAGTATCA 


CCAT 






5614 


(2) INFORMATION FOR SEQ ID NO: 100: 









45 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 9179 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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AAAGACAATG ATATGAAGTA TATGGATATC ACAGAaAAAG TGCCAATGTC GGAATGTGAA 120 

GTTAACCAAT TGCTAAAAGG TAAGGGGATT TTAGAAAATC GAGGGAAAGT TTTTCTAGAA 180 

GCTCAAGAAA AATATGAGGT TAATGTCATT TATCTTGTTA GCCATGCATT AGTAGAAACA 240 

GGTAACGGCA AATCAGAATT AGCAAAAGGC ATTAAAGATG GGAAAAAACG CTATTACAAC 300 

TTTTTTGGTA TAGGAGCATT CGATAGTAGT GCTGTTCGTA GTGGGAAAAG TTATGCTGAA 360 

AAGGAACAAT GGACATCACC AGATAAGGCG ATTATTGGTG GTGCAAAGTT CATTCGTAAT 420 

GAATATTTTG AAAACAATCA ACTGAATTTA TATCAAATGC GATGGAATCC AGAAAATCCT 4 60 

GCGCAACATC AATATGCGAG TGACATTCGC TGGGCAGATA AAATTGCCAA ATTAATGGAT 54 0 

AAATCCTATA AGCAGTTTGG TATAAAGAAA GATGATATTA GACAAACATA TTATAAATAA 600 

GACATCGGTG CTTAAAGGAG CTGGAACAAT TTATTGTTTC GAGCTGCTTT AGCGCATTCT 660 

GAGTGTGTTA GTTAAATGGA TTTTAACCTA ACAAAAAACG CTATATAGCA TCAAATATGC 720 

TATATCCCAC ATCATTGTTA CAAATGTACA TGATGTAAAT GAATATTGCT GTCTAAATGT 780 

GCATGTAATA TACAATGGTG CAGATAATAC ACTTAAGTCC TTAAAAATGA AACGTTAgTT 840 

CCAAGAGTCA TTTTTAAACA ATAGTGCATG TGATAAAATA GAAAAGAATG AAAAATATAG 900 

AGGTGACAAT ATGAAGATAG CAATTATAGG TGCAGGCATC GGTGGATTAA CAGCTGCTGC 960 

ATTATTACAA GAACAAGGTC ATACTATTAA AGTCTTTGAA AAAAATGAGT CAGTTAAAGA 1020 

AATTGGCGCT GGGATTGGTA TCGGAGATAA TGTGCTTAAA AAACTAGGTA ATCATGACTT 1080 

AGCTAAAGGT ATTAAAAATG CTGGGGAAAT CTTATCTACA ATGACAGTGT TAGATGACAA 114 0 

AGATGGCCTG TTAACTACTG TTAAATTAAA AAGTAATACA TTGAATGTGA CGTTACCACG 1200 

CCAAACATTA ATTGACATTA TTAAATCTTA TGTAAAAGAT GACGCAATAT TTACAAATCA 1260 

TGAAGTCACG CATATAGATA ATGAGACAGA TAAAGTTACC ATACATTTCG CGGAACAAGA 1320 

AAGTGAAGCA TTTGATTTAT GTATTGGTGC TGATGGAATT CATTCTAAAG TGAGACAATC 1380 

TGTAAATGCT GACAGTAAAG TATTATATCA AGGGTATACA TGCTTTAGAG GTTTAATTGA 1440 

TGATATTGAT TTAAAGCATC CGGaTTGTGC AAAAGAATAC TGGGGaAGAA AAGGaAGAGT 1500 

AGGTATTGTT CCGTTATTAA ATAATCAAGC ATATTGGTTC ATTACAATTA ACTCGAAGGA 1560 

AAACAATCAT AAATATAGTT CGTTTGGTAA ACCTCATTTG CAAGCATACT TTAATCACTA 1620 

TCCAAATGAA GTTAGAGAGA TCTTAGACAA ACAAAGTGAA ACAGGTATCT TATTGCATAA 1680 

TATTTATGAT TTGAAACCAC TCAAATCTTT TGTTTATGGT CGTACTATTT TACTAGGAGA 174 0 

TGCAGCACAT GCGACAACGC CTAATATGGG GCAAGGTGCT GGACAAGCAA TGGAAGATGC 1800 
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TAAAATACGT GTCAAACATA CTGCAAAAGT AATTAAGCGT TCTAGAAAAA TCGGTAAAAT 1920 

TGCCCAATAT CGTAGTGGTT TATTTGTTGC AGTTAGAAAT CGTATTATGA AAATGATGCC 1980 

AAATGCATTA GCAGCTGGAC AAACTAAATT CTTATATAAA TCGAAAGAAA AATAATACAA 2040 

CAATATGAAA ACCCCCGTAT GTTGAAACGA GAGCTCAACA TATGGGGGTT CTTGTTTTTA 2100 

TAATGTTATT ATAATAAATT CAATTATTAG TTAACGACAA ATTGTGGTTT CTCACCTTGA 2160 

ACGGCACTAA TTGCAGCATT AGCAACAATT TTAGACATCA TGTCACGTGC TTCAAATGTA 2220 

GCATTACCAA. TATGCGGTGT TAATACTACA TTATTAAGTG ATTTTAAGTC ATCGGTAATA 2280 

TCTGGTTCAA ATTCATATAC ATCAAGTGCA GCACCTTCAA TTTCATTATC TTTCAATGCT 2340 

TGCACTAGTG CTTGTTCGTG CACGATTGGA CCACGAGAGG CATTGATTAA ATACGCCGTA 2400 

GATTTCATCA TTTTAAATTG TT C TGTATCA ATTAAATGAT GCATTTTAGG ATTATAAGCA 2460 

20 GCGTTGATAG TGATAAAATC TGCATTCTTT AATAGTGTAT CTAAATCTAC ATATTTTGCA 2520 

CCGATTTCTC GTTCTTTTTC TTCTTTGCGA TTAGGTCCAG TGTATAGCAC ATCCATGTCA 2580 

AATGCTCTTG CACGACGAGC TACTGCACTA CCAATTTCAC CTAAACCGAT AATGCCGATT 264 0 

GTTTTCCCAG ATACTTCTCT ACCTCTGAAA AATAAAGGTG CC CATC CATC AAATCCAGTT 2700 

GTACGTGATA ATTGGTCCCC TTCAACAATA CGACGCGCTA CTGCAAGTAC TAATCCAATT 2760 
GTTAAATCAG CAGTCGCGTT TGTTGATGCT TTAGGTGTGT TTGTAACATC TATACTTTTT . 2820 

TCTCGGGCAT ACTCGATATC AATATTATTA AAACCAGCGC CATAGTTGGC AATGATTTTT 2880 

AAGTCTTTAC CAGCATCGAT AACATCTTTA TCAACGTTTG TAGATAATAA ACTAATTAAG 294 0 

GCAGTCGCGT TTTTAACACC TTTAATTAAA GTGTCTTTAT CGACTAATCC TTTACCTTCA 3000 

TACATTTCAA CTTCAAAATG TTCTTGTAAA AGTTTTAAAC CTACTTCTGG TATtGCACCA 3060 

gCAACATAAm CTTTTtCCAT AAAAGAtCAC TCCTTTTATC TTAGTATAGT AGAAGATTAG 3120 

40 "ACAGTATACA ACTATGTCAT GATGTCTTGT GTATCAATGA TGTAAGCGCG TACTTTTGAT 3180 

GGAGGCGATA TAACTTAGGC ACTGTAGAAC TATGAATATT GTAATGTGGA AAAACTGGAT 324 0 

CAATTAAATT AGATAACGTA GTTTTAAAGT TAATAGTATT AGAAAAAATT AATATTTTGA 3300 

45 ATATGGGAGG AAATATAAAT AAGTAGGTGG CAACGAAAAA TAGCAAAAAA AGAGCTTCTC 3360 

CTATAAAGGA AAGCTCAAAG TTTTTTGATG ACATATGTAC TAGAATTAAG TTTCAAGACA 3420 

ATATGTATCA TCGTGTTTAT ATTAAATATG GATGTAGTTG TAGTTACCTG CTTCACTTGC 3480 

SO 

AGAAATAGTT CTAGAACTTA CTGAGAAAGG TCCGCCACTA TAATTCATTT CTGAAATTGT 354 0 

AACTGAACCA TCACTGTTTA CACTTTCTAC ATATGCAACG TGACCAAATG GTCCTTCAGA ' 3600 
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AGCAGCAGCC CAATTATTAG CATTTCCCCA 
ATATACAtAC CAAGTACATT GTCCTGCAGT 
5 TGTAGTTGTC GTAGTTGTCG TAGTCGTTGT 

GTAATTTGTA TAATTTTCAG CAGCATCTGC 
GATTCCTGCT GTTAACGTAG TTGCTGTTAC 

10 

TTCTATATCT TTTTTTATAA ATAAAACGTA 
ATG ACAAT AG TTACTTTAAC AAAATtAATG 
AAGAATAAAA AAACTTTGAC TAATTTTGTA 

15 

AACAGATAAT TAATAGGAAA TATTTATTTG 
GGTATTATAT ATTCTTGGCC ATTATAATAT 

20 GATAATATTG AGAAAGCGAA TATGGATAAA 

ATAATAATGA AATCAATATC TGTAGCAATT 
AAAACGATAG ACCAAATAAT ATAAGAAATC 

25 TCAACTAGTT TCGATTCATC TTTTTTCAAT 

GTGAATAAAC TTAATAAATA GATAAGCATC 
TTGGGTTGAT GATTTGTTAC GTCGTTCATT 

30 

ATTGTAATAT TATCTTTAAC TATAACAAAA 
AATTATTAAA AATAAAAATA ATTGGTGGAC 
ATATATACTT AACATTTATA ATGATGCGTA 

35 

CGTATAATTT GTTTTTAATT TTAACCAAAG 
ATTGTAGGAT CAGGAAATGG CGCAGTTACG 

40 GATGTTAAAT TATATTGTCG TAATCAATCT 

GGCGGATTTG ATTTTAATAA TGAAGGTGAT 
GATGATATGG AATATGTTTT AAAAGATGCT 

45 TACATAGAGT ATTATGCTGA TGTAATGGCA 

TTCAACATGG CTGCAGCAAT GGGGTCAATT 
ATTGAAACAA AACCAGAACT AGCGGAAgcT 

SO 

TTTGAAAATG CAGCAGTTGA TTTATCTCTA 
GATAGAAGCT GTCTAAATGA TTGTTATGAC 
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AGTAGAACCG ATTTCTCCGC CAACTTTATC 3720 

GTATAAGTTA CCAGAATGTG AAATTGATGA 3780 

AGTTTGAGTC GTGTTGTAGT TATAGTTGTT 3840 

ATGATGTGCT TGACCTACTA ATGCTGTGCC 3900 

TAATTTTTTC ATGAATAAAG TCCTCCAAAG 3960 

GCGACTGTTT TATTCTCACA TCTCGAATTG 4020 

cTTCTTGTGG GGAATGTTAT TGATTTGTAA 4080 

ATAAAAATTA GTCAAAGTTA CAATGAGATT 414 0 

TAATATGTTf AAATAAATCG AATTGTTAAA 4200 

TTGACACACG CAATAATTGT GAATACAAAA 4260 

ATACCGATAA ACGTAATGAT GAAACCTATA 4 320 

AGGAAAACGC CTATTAAAGT GATAACGACT 4380 

GTATAGTTAA GATAATTTTT TCCAGCACGA 4440 

AACCATATTA TCAGTGGACC AATAATAGAT 4500 

GCCATAATGT TCTCATCATT GGATTTGCGA 4 560 

TCAGTTGTCA TATTAGACAC TCCTTTGAAA 4620 

TATAATCAAA AAT AAACATG TTTATTAAAC 4680 

GTCGGCGTTT AAATAGGTTA ATTTAAGGTT 4 74 0 

ATGAATTCGC ATCATTTTTA TATTGT CTTA 4 800 

ATAGAAAGAG GGTTGTTTAT GAAAATAGCA 4860 

GCAGCAGTAG ATATGGTGAG CAAAGGCCAC 4920 

ATAAGTAAGT TTCAAAACGC AATCGAAAAG 4980 

GAACGTTTCG TAAAATTCAC TGATATTAGT 5040 

GAAATTGTTC AAGTGATTAT TCCATCTTCA 5100 

GAGCATGTAA CTGATAATCA GTTGATATTC 5160 

CGTTTTATGA ATGTTTTAGA AGATAGACAT 5220 

AATACGTTGA CGTATGGTAC GCGTGTCGAT 5280 

AATGTACGTC GTATCTTCTT TTCAACATAT 5340 

AAAGTTTCAA GTATTTATGA TCATTTAGTA 5400 
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CCAACATTAT TGAATGTCGG - TCGCATTGAT TATGCTGGCG AGTTCGCTTT ATATAAAGAA . 5520 

GGAATTACTA AACATACAGT TAGATTACTT CATGCAATCG AATTAGAACG TTTGAATTTA 5580 

5 GGCCGTAGAT TAGGTTTTGA ATTATCAACA GCTAAAGAAT CACGTATTGA ACGTGGTTAT 5640 

, TTAGAACGTG ATAAAGAAGA TGAACCATTA AATCGTTTGT TTAATACAAG CCCAGTATTT 5700 

TCACAAATTC CAGGACCAAA TCATGTAGAA AGCAGAT ATT TAACTGAAGA TATTGCATAT 5760 

10 

GGTTTAGTAC TATGGTCAAG CTTAGGTCGT GTTATTGATG TACCGACACC AAATATAGAT 5820 

GCAGTAATTG TAATTGCATC AACCATTTTA GAGAGAGACT TCTTTGAGGA AGGCTTAACA' 5880 

GTTGAAGAAA TTGGTTTAGA TAAGCTTGAT TTAGAAAAAT ATTTAAAATA AATGATGGCT 5940 

15 ' 

TGAAGATAGA AAAGGATATA GCATTATGCA AAAGCAATAA ATTGAAGAAA AGAGGTTTCT 6000 

CATCAATAAG CGnAGGGGAC GATAGATGAT GAAAAGAAAA CCCACCTTTT TAGAATCAAT 6060 

20 TTCGACAATG ATTGTAATGG TTATTGTTGT TGTAACAGGC TTTGTGTTTT TTGATATTCC 6120 

AATTCAAGTA TTATTAATTA TTGCCTCAGC ATATGCCACA TGGATTGCAA AACGTGTAGG 6180 

CTTAACATGG CAAGATTTAG AAAAAGGCAT TGCAGAACGT TTAAATACTG CAATGCCTGC 6240 

25 AATTTTAATT ATACTAGCGG TAGGAATTAT AGTAGGGAGT TGGATGTTTT CTGGCACAGT 6300 

GCCAGCCTTG ATTTATTATG GCTTAGATTT ATTGAATCCA AGCTATTTTT TAATATCAGC 6360 

CTTTTTTATA AGTGCTGTTA CATCTGTAGC AACTGGTACA GCATGGGGCT CTGCATCAAC • 6420 

30 TGCAGGGATT GCACTTATTT CTATTGGTAA TGAATTGGGG ATTCCTCCAG^ GGATGGCAGC -6480 

GGGTG CTATT ATAGCAGGGG CTGTGTTTGG CGATAAAATG TCACCATTAT CAGATACAAC. - . 654 0 

TAATTTAGCG GCGCTTGTTA CTAAAGTTAA TATATTTAAA CATATACATT CGATGATGTG 6600 

35 

GACGACGATA CCTGCATGAA TCATAGGTTT ATTAGTATGG TTTATTGCTG GATTTCAATT 6660- 

TAAAGGGCAT TCAAATGATA AACAGATTCA AACTTTGTTA TCAGAGCTTG CACAGATTTA 6720 

TCAAATTAAC ATATGGGTCT GGGTTCCCTT AATTGTGATC ATTGTTTGTT TGCTATTTAA : 6780 

40 

AATGGCTACA GTGGCAGCTA TGCTAATATC AAGCTTTTCT GCCATTATAG TGGGGACTTT 6840 

TAATCATCAT TTCAAAATGA CAGATGGTTT CAAAGCAACA TTTAGTGGTT TTAACGAATC 6900 

45 AATGATACAT CAGTCTCATA TTTCATCCAG TGTGAAAAGC TTGTTAGAAC AGGGTGGTAT 6960 

GATGAGTATG ACCCAAATAT TAGTAACGAT ATTTTGCGGA TATGCATTTG CAGGTATTGT 7020 

AGAAAAAGCA GGATGTTTAG AAGTCTTATT AACTACTATT TCTAAAGGCA TCCATTCTGT ■ 7080 

50 AGGAAGTTTA ATATGTATTA CTGTTATTTG TTGTATTGCG CTTGTATTCG CTGCAGGTGT 7140 

TGCTTCGATT GTAATTATTA TGGTCGGTGT GTTAATGAAA GATTTGTTCG AAAAATACCA -7200 
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10 



15 



20 



25 



30 



35 



40 



45 



AATACCATGG GGAACATCAG GTATTTACTA TACGAATCAA CTTCATGTCT CTGTTGAAGA 7320 

ATTTTTCATA TGGACAGTAC CATGTTATTT ATGCGCAATT ATAGCAATTA TCTATGGTTT 7380 

TACAGGGATA GGTATTAAAA AGTCATCGAA TTCACGTTTA ACTTAATGTG AGCGTGGAAT 7440 

ATATATAATA TGTTGAAACA CTTTAATCAT TTATAATTGT AGCGGTTATA ATTTGAAAAG 7500 

GTTTTAACTT AGAATAAATA TCCTCTATGC ATATACTGAA TATGTTTTGT AGCGGAACAT 7560 

GTTGATATAT GTAATGTAAG TTTTATGTCA TGATTTGTAA TGACTAAATT AATTGAGAAT 7620 

TTGAAGGCAA GTATATTTGT AAGTACTTTA ACTAAAAATT TATCAATGTA TAGCCGATTT 7680 

GACATGCCTA AATTTGGGTG TGTCAATGGC TGTATGTTGT TTATTCTTTA TTACAGAGTG 7740 

AATCGGATTG GTGAAAATCG AAATTTTGAG ATTTTTACCA ATTCGATTTT TTTCATAGAA 7800 

ATTAAAAAAG CCAACAAGGC TCTTGAAACC TTGTTGGCGT AAACATAGCC ATCACTAATT 7860 

AGTGAATGAA GTTATAACCA GCAGCTTGGC TAGCTGAGAT TGTACGTGAA GTTACAACAC 7920 

CTGGGCCATA ACCATAGTTC ATTTCTGAAA CTCTTACTGA ACCATTGCTG TTAACACTTT x 7980 

CAACGTATGC AACGTGACCG TATGCACCTT GAGTTGTTTG CATAATTGCA CCAGCTTTTG 8040 

GTGTATTGTT CACTGTGTAA CCAGCTCTTG CAGCTGCGTT AGCCCAGTTA CTTGCATTGC 8100 

CCCAAGTTGA ACCGATTTTA CCACCTACAC GATCAAATAC GTAGTATGTA CATTGACCAG 8160 

AAGTGTATAA GTTACGTCCT GAAGTATAAC CACTTGAGAT TGAACGGCCA TTTGATGATG B220 

GAGCCATAGT TGTAGTTACT TGAACATTGT TGCTTGAAGT GCTGTAGCTT GCACCTAAAC B280 

CACCAGTACG GTAGCTGTTT GTGTTGTAAC TATTATAGTT ATTGTAGTTA TATGATTG AT 8340 

TATTATTTGA GTAGTTGTTG TAACGGCTGT AGTTATTGTA GCTATAACCG TTGTTGTAAT 84 00 

TGTTATAGTT ATTGTAACCA TTGTAGTAGT AATAGCTGTA GTAGCCATTA TCTTGGTTTA 8460 

ATTGACTTGG ATGCCAGTTA CCTTTCCATG TGTAATGGTA GTTACCTTGT GCATCAATAG 8520 

TGTAAGTATA GCTATATGAT GTTGGGTCGT TTGGATTATA ACCGTAGTTA TCTTGCTCAG 8580 

AAGCATGAGC TTGATTTCCT GATGCAATTG CGATTGTAGC GAATCGTGCA GTTGCGATAG 8640 

TAGCTGTAGC GATTTTCTTC ATTTTAAAAA TATCCTCCTA AAAATTTTAA ATCTAAAATA 8700 

TTTTCGTAAT GTCCGTGTGA CAAAATTAAT GTTATAAGTT ATCTCTCGTA ATTAAACGAC 8760 

AAGAAAGACT ATAACAGAAA TTAGCGTCCT TGTGTGCTTT GTTAACGTTT TGTAATTTTT 8820 

TGCTAAT AT C TTGACACAAT AGAATTTTAA AAGTATAGAA ATTTGCATTT TGGAAAACTT 8 8 BO 

ATAACTACGG CATTCTTTGT GAAAACTGAA TGTTTCGAAA ATAAGTCTGT TACAAATTTG 8940 

TAATATTACT GAAAATTCTA AATGTATATT TTGTGCATAA TATAGGACTT TTAATCAGAA 9000 
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GGATGAAAAT GTATATTTAA TGGATAAAAT ATCCTAATTT AGCATAAAAA AATGTTTTAA 
TAAAAGTATT ATTTGATATA ATCGATTTAT GTTTTGTTAC TGCTAAAAAA CATGTGGCG 
(2) INFORMATION FOR SEQ ID NO: 101: 

(i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1868 base pairs 

(B) TYPE: nucleic acid 

<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 101: 
CCTTCAGCCA TTTGACTTCG ACATGAGTTG CCTGTACATA TAAAATAAAT TGTTTTTTTA 
GTCATAACAA TCTCCTAATT AATTAAAATA TGATAAGTGT TAGATACAAC CCTATGAGGG 
TTATAAATAG TACTGGAATT GTAATGATGA TACCAGTTTT AAAGTATGTG CCCCAAGAAA 
TCTTAACATC T T T T T GtGTT AAGACGTGTA ACCACAGTAA TGTAGCTAAA GAGCCTATCG 
GTGTAATTTT TGGACCTAAA TCAGAACCGA TAACATTCGC ATAAATTAGG CCTTCTTTTA 
ACATGCCATG GACATTTGAT TGACCAATAG CAATCGCATC TATTAAAACT GTAGGCATAT 
TATTCATTAT TGATGATAAA AACGCTGAAA TGAAGCCCAT TCC CAAAATA GTGCTAAATA 
GACCGTAATT GGAAATATAT TCTAATATTT TAG C CAAT AT TAAAGTAATG CCAGCATTTC 
TTAAG CCGAA TACGACGATA TACATACCAA .TTGAAAATAA TACTATATTC CAAGGTGCGC 
CCTTAATGAC TTGCTTAATA TTTACAGCAT TTGATTTACG AGC CAACATT AGAAAAATAA 
AAGCAATGAT TCCAGTGAAA ATTGATACCG GAATTTTAGT AAATTTACTG. ATTAGATAGC 
CGAAAAGTAA TATAACTAGA ACAATCCaTG AAATTTTAAA TAGCTTTAAA TCATTAATGG 
CATCFTTAGG ATGCTTTATA TTATTATCAT CAAACGTTTT AGGTATCGCT TTTCTAAAAT 
- ATAACCACAA TACTATAATA CTTGCTAAAA GCGAGAATAA ATTAGGTATA ATCATTCTAC 
TAAAATATCG AACGAATCCT ACATGAAAAT AATCAGCAGA TATAATATTC ACTAGATTGC 
TCACGATTAA AGGTAAAGAA GTTGTGTCAG CTATAAAACC ACTCGCAATA ATnAAAGGGA 
ATATGGCCCG CTTACTAAAA CCTATATTTT TAACCATCGC TAATACAATA GGCGTTAAGA 
TTAAcGTGCG CCATCATTTG CGAAAAATGC AGCAACAATG GCACCCAATA ATATGATATA 
AACGAACATT TTTAAACCAT TGCCTTTTGA AG CATGAAGC ATGTGAATAG CTGACCATTC 
GAATAATCCA ACTTTATCTA ATATTAATGA AATAAGAATG ACTGAGACAA AAGTCAAAGT 
AGCATTCCAA ACAATACCTG TTACTTCGAA AACATCGGAA AAACTTACAA CACCAGTAAT 
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TAATACAAAT AATAAAGTTA CTAGAAAAAT GAGTGTCGCT AAAGTTGTCA TCATTAG CAT 1380 

TCACCAGTCT TAAGGTTATG ACAAATACAT CGTTGGTTAG AGGTATGAAC CTTAGACAAG 144 0 

TTATTAATTA CGGACTCAAA AATATTATGA TTgAGCTGGT ATAAATGTTT ATTTCCGATT 1500 

TTTCGTGTCG TAACTAAGTT GGTTTTTACT AATGCTTTCA TATGrTAGCT AAGTGTAGGT 1560 

TGAGAGAATT GAAAATGTGC TAACAAATCA CAAGCGCATA ACTCTCCACA AGAAAGTAAA 1620 

TCTAGTATTT CTAATCTGCT TGAATCTGAT AAAACTTTTA AAAATGTTGC TAGTTCTTTA 1680 

TACGTCATAA CATACCTCCT AGACGTTAAA TAGATTATCA TCTATATAGA TGAATGTCTA 174 0 

TGTTCCTTTG GTATATTACA CGATATGACT ATGTAATTTA AATTTGGTTT TAGTATTAAA 1800 

AGGGTATTAA AGATAAATTA TAGATATTGA TTTTGCAAAA TATACTCTTT GTTCTGCATT 186 0 

GAAAAAGG 186 8 
20 (2) INFORMATION FOR SEQ ID NO: 102: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 15249 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
25 (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 102: 

30 

ATTTATGAAA TCCATAGCnA TAAACATTAT TCTTGCATCG G CTATACAAA CAGTTACCGC 60 

AAGCAAATTT GTATATCAAC CTGGAATTGT GTTCACGTCA ATGGCaAATG CCGATGATGT 120 

GTTATCAGGC GATAGTTATT TTATGGCTGA ATTAAAATCT ATTAAGCGTA TTGTTGAAAT 180 

TCCAGATAAT CAAAAAATAT ACTGCTTTAT AGATGAAATT TTTAAAGGTA CCAACACAAC 240 

TGAAOGAATT GCCGCTTCAG AATCAGTACT ATCATTTTTA CATGAAAAAT CTAACTTTAG 300 

AGTTATTGCA GCAACACATG ATATTGAGTT AG CTGAACTC TTAAAACAAC GTTATGAAAA 3 60 

TTACCATTTC AATGAGGTAA TAGAAAATAA TAACATACAT TTTGATTACA AAATTAAGCC 420 

TGGCAAAGCA AATACACGTA ATGCCATCGA ATTATTAAAA ATCACTTCAT TTCCAGCAAA 480 

45 AATATATGAA CGAGCAAAAG ATAATGTCCC GAAAATTTAG CATTTAACTT TAAACATAAA 540 

AACGTCAGCT ATCACATGAC AGAAGACTAT GAACAGTTTC AATAATGTTC ATAGTAATCA 600 

TGTTAATAAC TGACGTTTAT TTTATTCTGC AGAATACTCT TCTAAATCTA TATTGCTGTG 660 

so 

CCCATTTAAT GCTAAATCAG CAAATCGACC TTGCTGATAC AAATAGTGGC CGGCAACGCC 720 

TATCATTGCA GCATTATCTG TGCATAATTT AGGACTTGGG ATAGTTAATT GAATGTCATT 780 
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AACAATTAAT CGCTGAACAG CATATTCTTT 
CTCTACAACA CTGTTTTGAA AGCTCGTTGC 
5 TTGTCGTTGA TTGTGAAGTT GATTGATTAC 

ATAACTATCT TTATCCAACC AAACACGAGG 
CAACCGATCA ACTTGTGGAC CACCTGGATA 

10 

ATAAGCCTCA CCTACTGCGT CATCTCGTGT 
CTTCATATAA ACTAATTCAG TATGTCCACC 

1S TAATGGCTCT TCTATGTGAT TAG CAT AT AT 

TGGCTnATCG TAAGCAAATG CCAATGCTTT 
AATTAGTCCA GGGCCTTCTG TAACCGCTAT 

20 ATCCCCTAGA GCCTCGTTTA TTGTTGCTGT 

TTCGGGAACG ACACCGCCAA ATCGTTTATG 
TAAAATATCT CTGCCATTTT TTATAACACT 

25 AGCTAGTATT AATATATCTT TAGTCATTTA 

CTTCACCATA ATAATTTTTA CGTTTACCAC 
GTTGTGCCAC TTTATTATTA ACTCTTACTT 

30 

CATAGTTTAT TCCGTATTTT AAAAGCATTT 
CGATTGCAAC TGTTGTAATT TGAGCTTGAT 
TAATTTGTTG TTCAAATTCt AAGACAAAAT 

35 

GATAAAATGC GTCAATTGTC CAAGAACTGT 
CTTQTGGCAC ATCTTGTTTA GTCATCTCTC 

40 CCAATTTCGT TCCGCCTCAG CTAATTTATG 

AGGTTTATCT AGCAATTGAT ACATGACTGA 
TTGTAATTCA TCTTGTAATT TTACAGTATC 

45 ATCTTCTAAA AAAGGTCGCA ATGCCTCTAT 

TAATTGACCA TTTTGCCACT GGAATATGCC 
CACAGGAACC AATAATTTAT CAGTATGATC 

50 

AACACCATAT AATTTAACAT CTAACGCATA 
ACGTAAGCCA GTATATGAAC CAGGACCTTC 

55 



ACAAGCTTGA ATAGCTTTAA ACGTGAGCAC 900 

T ACGTT AG CT TCAATGATTG GaATATTTTT 960 

GGCACTTTTC AACCCACTAA AACTAAAATC 1020 

GAATGAATAA GTATCTTCAC CTTCAGCAGC 1080 

ATTTAAACCA ATTGTTCGTG CCACTTTATC li40 

TTCACCAATG ACTTCAAATG ATAAATGATC 1200 

TGAAACAATA AGTGCAATTA GCGGGAATGT 1260 

ATGTCCTGCA ATATGATGAA CAGGAATAAG 1320 

GGCTGCATTA ACACCTATTA GTAACGCACC 1380 

GGCATCAATA TCTTCTATTG ATACATCGGC 1440 

TATACCTTCA ACGTGATGTC TACTTGCCAC 1500 

ACTTTCAATC TGACTTAAAA CTGTATTTGA 1560 

AACGCTTGTT TCATCACAAC TTGTTTcAAC 1620 

AATTCACCCA CATAACCATT GCGTCCTCAC 1680 

CATATTGAAA TCCTAAATTT TCATATACAT 174 0 

CTAAACTCAT CACATCACAA GTGTGACTTG 1800 

GACCTAAACC ATAGCCTCTA TAATTATCAT - 1860 

CGATAACAAT CCATAAACCT AAATAACCAA 1920 

ATTTCGCAAA GTTATTTTGC TCTATTTCAT 1980 

CATTGAAACT CCGACGCTCA AGATCAAAGA ^ 2040 

TAATGTTTAA TTGTTCTTTT GACTGTTGAT 2100 

GTATTTAGGA GTAAATGTAT GTACGTCTGA 2160 

TGCATTTGGT AGctGCGCAA TCACTTCACC • 2220 

TTTCCCAATA TAAATAAATG GTTGGTTTAA 2280 

CGACATATAT TGATCTTCTA AAATAGTCAC 234 0 

TGTATAAACT GCTTGTCGTC TTGCATCAAA 2400 

GATTGTTGCT GCCAATGCCT TTAATGATGA 2460 

CGCTAATGTT TTAGCAACAG TAACACCGAT 2520 

AGCAACAATA ATCGCATCTA ATTGCTGTTT 2580 
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TTGTT TAG AA 


. TCCGTAGTTA 


, TTTCAGCTAA 


AACTTCATCG 


TTTTGCATCA 


ATGCTACTGA 


2700 




TAATGGTTGA 


TTCGATGTAT 


CAATG AG CAG 


CGAATTCATG 


GATAATTGCC 


TCCTTAATTT 


2760 


5 


GTTCATAATG 


TTCTCCTTGC 


GCGAACAACT 


CAATTTGTCT 


TGTATTTTGA 


GATATTGTTG 


2820 




AAATGTTAAT 


AGATAAATGC 


GTCGGTGGAA 


GTAAATCTTT 


TATAAATTGA 


CTCCATTCAA 


2880 


10 


TAACAGTAAT 


TGCCTGATCT 


TCGAAAAATT 


CATCAAATCC 


TAAATCTTCA 


TCAGAATCTT 


2940 


CTAAGCGATA 


ACAATCCATA 


TGATGCAATT 


TTAAATTTTT 


ACCCCTATAT 


GATTTAATGA 


3000 




TGTTAAATGT CGGGGAATTA 


ATCGTACGTC 


TTACACCAAG 


AGCTTTTCGT 


ATAAATTGCG 


3060 




TTAACGTTGT 


TTTACCTGCT 


CCTAAATCTC 


CGTTAAGTAA 


AATCAAATCA 


CCACTTTTCA 


3120 




ATTGCTCAAC 


TAAAAATATA 


GCAAATTGAT 


TCATTTCATC 


TAAATTATTT 


ATCTTTATCA 


3160 




ATGTTGATTC 


TCCTATATTA 


TGCTTTTCAT 


TCATAAAAAT 


GATTATCCAT 


TGTTCAATCG 


3240 


20 


TATCTAACTT 


TATATTTAAC 


CTTTATATTG 


TAACAAATTT 


CAACTTAAAT 


TTCTTATCTT 


3300 




TGAAACAGAT 


TATCTATT CA 


AAGTTAATTG 


TAAGAAAATT 


TAAAATATTT 


GTTGACATAC 


3360 




TAAAGCAGAT 


ATAGTAAATT 


AAATTTATCA 


AATTTTTAGA 


CAATTCTAAC 


TATTAAAGTG 


3420 


25 


ATATATACCA 


TTCACGGAAG 


GAGTATAATA AAATGCTTAA 


TCAATATACT 


GAACATCAAC 


3480 




GGACAACTTC 


AAATATT ATT 


ATTTT ATTAT 


ACTCTTTAGG 


ACTCGAACGT 


TAgTAAATAT 


3540 


30 


TTACTAAACG 


CTTTAAGTCC 


TATTT CTGTT 


TGAATGGGAC 


TTGTAAACGT 


CCCAATAATA 


3600 


TTGGGACGTT 


•rrrri'ATGTT 


TTATCTTTCA 


ATTACTTATT 


TTTATTACTA 


TAAAACATGA 


3660 




TTAATCATTA 


AAATTTACGG 


GGGAATTTAC 


TATGCGAa CG 


AgcATGATCA AAAAAGGAGA 


3720 


35 


TCACCAAGCA 


CCAGCAAGAA 


GTCTTTTACA 


TGCCACGGGC 


GCGCTAAAAA 


GTCCAACTGA 


3780 




TATGAACAAA 


CCATTTGTAG 


CTATTTGTAA 


CTCTTATATT 


GATATTGTTG 


CTGGACATGT 


3840 




TCACTTGAGA 


GAGCTTGCAG 


ATATAGCTAA 


AGAAGCAATT 


AGAGAAGCCG 


GTGCCATTCC 


3900 


40 


ATTTGAATTC 


AATACAATTG 


GTGTTGATGA 


TGGAATAGCT 


ATGGGACATA 


TCGGAATGCG 


3960 




ATATTCTCTA 


CCATCACGTG 


AAATTATTGC 


AGATGCAGGT 


GAAACTGTAA 


TTAACGCTCA 


4020 




TTGGTTTGAC 


GGCGTATTTT 


ACATTCCTAA 


TTGTGACAAG 


ATTACACCCG GTATGATTTT 


4080 


45 


AGCAGCCATG 


AGGACAAACG 


TACCAGCTAT 


CTTTTGCTCT 


GGTGGACCAA 


TGAAAGCTGG 


a. i a n 




CTTATCTGCA 


CATGGAAAAG 


CATTAACACT 


TTCATCAATG 


TTTGAAGCAG 


TCGGCGCATT 


4200 


SO 


TAAAGAAGGA 


TCGATTTCTA 


AAGAAGAATT 


TTTAGATATG 


GAACAAAATG 


CCTGCCCTAC _ 


4260 


TTGTGGTTCA 


TGTGCTGGGA 


TGTTTACTGC 


AAATTCAATG 


AACTGTTTGA 


TGGAAGTTTT 


4320 




AGGTCTAGCA 


TTACCATACA 


ACGGTACTGC 


ACTTGCAGTC 


AGTGATCAGG 


GACGAGAAAT 


4380 
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TATCGTTACT CGCGAAgCAA TTGATGATGC 
AACAAACACG GTACTGCATA CGTTAGCCAT 
AGAGCGCATT AATGCTATTG CCAAACGCAC 
ATCGTATTCA ATGCATGATG TGCATGAAGC 
GATGAAGAAA GATGGCACGT TACACCCAGA 
TGAAAATAAC GAAGGCAAAG AAATTAAGAA 
ATATGATGCA CAAGGCGGTT TATCTATCTT 
TATTAAAGTT GGCGGCGTTG ATCCATCTAT 
CAATTCGCAT GATGAAGCTG TTGAAGCAAT 
CGTTGTCATT AGATATGAAG GACCTAAAGG 
TACTTCCTCT ATTGTTGGTC GCGGCTTAGG 
TTTTTCCGGT GCCACAAGAG GTATTGCAGT 
TGGACCAATT GCCTTAATTG AAGATGGTGA 
ATTAAACGTA AACCAGCCTG AAGATGTTCT 
TAAAGCGAAA GTAAAAACAG GTTATCTAGC 
TACAGGTGGC GTCATGCAAG TCCCTGAGAA 
GGTTAAAATG TCTAAAACTC AACATGAAGT 
TGAATCACTT GAACCTGAAC AACTAAATGA 
AGAAGTGCTA GTAGAAGCTC TACTTAAAGA 
TGGTGCCGTA CTACCTTTAT ATGACACGTT 
AAGSCACGAA CAAGGTGCTG TTCATGCTGC 
GGCGTCGTTG TAGTTACAAG CGGTCCaGGT 
GCACATTGCG ACTCTTTACC TCTAGTTGTA 
GGTAAAGATG CATTCCAAGA AGCGGATATT 
AATTATCAAG TGAAACGTGT TGAAGATATC 
GCTAATTCTG GACGCAAAGG TCCTGTAGTG 
GCTACAAATG TGGATTTATG CGACGAAATC 
CCAGAAAATA AAGACATTGA CACTTTCATC 
GTATTAGCCG GCGCAGGTAT TAATCAATCA 



ATTTGCACTT GATATGGCTA TGGGTGGTTC 
TGCCAATGAA GCTGGTATTG ATTATGACTT 
GCCATATTTA TCAAAAATAG CACCTAGTTC 
TGGTGGCGTC CCAGCAATTA TTAATGAATT 
TAGAATCACA GTTACTGGCA AAACGTTACG 
CTTTGATGTC ATTCACCCTC TTGATGCACC 
ATTTGGTAAT ATCGCCCCTA AAGGCGCAGT 
CAAAACATTT ACTGGGAAAG CAATTTGTTT 
AGACAATCGT ACCGTTCGTG CAGG CCACGT 
TGGACCAGGT ATGCCTGAAA TGTTAGCACC 
TAAAGATGTT GCATTAATTA CTGATGGGCG 
TGGTCATATT TCCCCTGAAG CTGCATCTGG 
TGAGATTACT ATTGATTTAA • CAAATCGTAC 
AGCGCGTCGC CGAGAATCTT TAACACCATT 
TCGTTATACT GCCCTAGTAA CTAGCGCAAA 
TTTAATTTAA. TTTATTTTTA TATTGGAGAT 
AAACCAAAAT: ATTGACCCTT TAAAAATGGC 
AAAAACTTTA AATGATATGC GTTCAGGATC 
AAATGTGGAT TATTTATTCG GTTATCCTGG 
TTATGATGGT AAAATCAAAC ATATTTTAGC 
AGAAGGTTAT GCACGTGTAT CTGGTAAamT 
GCAACTAATG TAATGACAGG TATTACGGAT 
TTCACTGGAC AAGTTGCTAC ACCAGGCATT 
CTATCTATGA CTTCACCAAT TACAAAACAA 
CCTAAAATCG TACACGAAGC TTTCCATGTA 
ATTGATTTTC CAAAAGATAT GGGTGTTTTA 
AATATTCCAG GTTATGAAGT TGTTACAGAA 
TCACTTTTAA AAGAAGCGAA AAAGCCTGTC 
AAATCAAATC AATTATTAAC ACAGTTTGTT 
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GATACACTAT TT1TAOGTAT 


' GGGAGGAATG 


CATGGTTCTT 


ATGCTAGTAA 


CATGGCATTA 


6300 




ACTGAGTGTG ATTTACTCAT 


TAATTTAGGT AGCCGCTTCG 


ATGATAGATT 


AG CAAGCAAA 


6360 


5 


CCTGATGCCT TTGCACCTAA 


CGCCAAAATT 


GTACATGTAG 


ATATTGATCC 


TTCAGAAATC 


6420 




AATAAAGTTA TTCATGTAGA TTTAGGTATT ATTGCAGACT GTAAAAGATT e TTTAGAATGT 


6480 


10 


TTAAATGATA AAAATGTTGA 


GACTATAGAA 


- CACAGTGACT 


GGGTTAAACA 


TTGTCAAAAT 


6540 


AATAAGCAGA AACACCCATT 


TAAACTTGGT 


GAAGAAGATC 


AAGTATTTTG 


TAAGCCACAA 


6600 




CAAACAATCG AATATATCGG 


CAAAATTACA 


AATGGTGAAG 


CAATTGTTAC 


TACAGACGTG 


6660 


15 


GGACAACATC AAATGTGGGC 


AGCTCAATTT 


TATCCATTTA 


AAAATCACGG 


ACAATGGGTT 


6720 




ACAAGCGGTG GTTTAGGAAC 


AATGGGATTC 


GGTATTCCTT 


CGTCAATTGG 


TGCCAAATTA 


6780 




GCTAATCCTG ATAAAACAGT 


CGTATGTTTC 


GTCGGTGAOG 


GTGGTTTCCA AATGACAAAC 


6840 


20 


CAAGAAATGG CACTTTTACC 


CGAATATGGT TTAGATGTCA 


AAATCGTACT 


AATCAATAAT 


6900 




GGAACATTAG GTATGGTTAA 


ACAATGGCAA 


G AT AAGTT CT 


TTAATCAACG 


CTTCTCACAC 


6960 




TCAGTATTTA ATGGTCAACC 


TGATTTTATG 


AAAATGGCAG 


AAGCATATGG 


CGTCAAAGGT 


7020 


25 


TTCTTAATCG ATAAGCCAGA 


ACAACTGGAA 


GAACAATTAG 


ATGCAGCGTT 


TGCTTATCAA 


7080 




GGACCAGCTT TAATTGAGGT 


TCGTATTTCC 


CCTACTGAAG 


CTGTAACCCC 


AATGGTTCCG 


7140 


30 


AGTGGCAAAT CAAATCATGA 


AATGGAGGGC 


TTATAATGAC 


AAGAATTCTT 


AAATTACAAG 


7200 


TTGCGGATCA AGTCAGCACG 


CTAAATCGAA 


TTACAAGTGC 


TTTTGTTCGC CTACAATATA 


7260 




ATATCGATAC ATTACATGTt 


ACACATTCTG 


AACAACCTGG 


GATTTCTAAC 


ATGGAAATTC 


7320 


35 


AAGTCGATAT TCAAGATGAT 


ACATCACTTC 


ATATATTAAT 


TAAAAAATTA 


AAACAACAAA 


7380 


TTAATGTTTT AACGGTTGAA 


TGCTACGACG 


TTGTTGATAA 


CGAAGCTTAA 


TTTTAAGAGA 


7440 




aaggCaatga TGCGCTAATT AGTTATAGAT ATATCATAGG 


CTGCTAGTTA 


ACATCTGCGA 


7500 


40 


CTATTAGAAA GTTATATTTC 


AGAATTTTCG 


AAACACAAAA 


TATTTAATTA 


TTTGGAGGAA 


7560 




TTTATTATGA CAACAGTTTA 


TTATGATCAA 


GATGTAAAAA 


CGGACGCTTT 


ACAAGGCAAA 


7620 




AAAATTGCAG TAGTAGGTTA 


TGGATCACAA 


GGTCACGCGC 


ATGCACAAAA 


CTTAAAAGAC 


7680 


45 


AAf GGATATG ATGTAGTCAT 


CGGCATTCGC 


CCAGGTCGtT 


CTTTTGACAA 


AGCTAAAGAA 


774 0 




GATGGATTTG ATGTGTTCCC 


TGTTGGAGAA 


GCAGTTAAGC 


AAGCTGATGT 


AATTATGGTG 


7800 




CTATTACCTG ATGAAATTCA 


AGGTGATGTA 


TACAAAAACG 


AAATTGAACC 


AAATTTAGAA 


7860 


50 


AAACATAATG CGCTTGCATT 


TGCTCATGGC 


TTTAACATTC 


ATTTTGGTGT 


TATTCAACCA 


7920 




CCAGCTGATG TTGATGTATT 


TTTAGTAGCT 


CCTAAAGGAC 


CGGGTCATTT AGTTAGACGT 


7980 
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10 



15 



CAAGCACGTA ATATTGCTTT AAGTTATGCA AAAGGTATTG GTGCAaCTCG % TGCAGGTGTT 8100 

ATTGAAACAA CATTTAAAGA AGAAACTGAG ACAGATTTAT TTGGTGAACA AGCAGTACTT 8160 

TGCGGTGGTG TATCGAAATT AATTCAAAGT GGCTTTGAAA CATTAGTAGA AGCGGGTTAT 8220 

CAACCAGAAT TAGCTTATTT TGAAGTATTA CATGAAATGA AATTAATCGT TGATTTGATG 8280 

TATGAAGGCG GTATGGAAAA TGTAGGTTAC TCAATTTCAA ATACTGCTGA ATTTGGTGAC , .8340 

TATGTTTCAG GACCACGTGT TATCACACCA GATGTTAAAG AAAATATGAA AGCTGTATTA 8400 

ACTGATATCC AAAATGGTAA CTTCAGTAAT CGCTTTATCG AAGACAATAA AAATGGATTC 8460 

AAAGAATTTT ATAAATTACG, CGAAGAACAA CATGGTCATC AAATTGAAAA AGTTGGTCGT 8520 
GAATTACGCG AAATGATGCC TTTTATTAAA TCTAAAAGCA TTGAAAAATA AGATAGACCT * 8580 

ACAATGAGGA GTTGTTAAAT ATGAGTAGTC ATATTCAAAT TTTTGATACG ACACTAAGAG 8640 

20 ACGGTGaACA AACACCAGGA GTGAATTTTA CTTTTGATGA ACGCTTGCGT ATTGCATTGC 8700 

AATTAGAAAA ATGGGGTGTA GATGTTATTG AAGCTGGATT TCCTGCTTCA AGTACAGGTA 8760 

GCTTTAAATC TGTTCAAGCA ATTGCACAAA CATTAACAAC AACGGCTGTA TGTGGTTTAG 8820 

25 CTAGATGTAA AAAATCTGAC ATCGATGCTG TATATGAAGC AACAAAAGAT GCAGCGAAgC 8880 

CGGTcGTGCA TG TT TTTATA GCAACATCAC CTATTCATCT TGAACATAAA CTTAAAATGT 8940 

CTCAAGAAGA CGTTTTAGCA TCTATTAAAG AACATGTCAC ATACGCGAAA- CAATTATTTG 9000 

ACGTTGTTCA ATTTTCACCT GAAGATGCAA CGCGTACTGA ATTACCATTC TTAGTGAAAT 9060 

GTGTACAAAC TGCCGTTGAC GCTGGAGCTA CAGTTATTAA TATTCCTGAT ACAGTCGGCT 9120 

ACAG TT AC CA TGATGAATAT GCACATATTT TCAAAACCTT AACAGAATCT GTAACATCTT- 9180 
CAAATGAAAT TATTTATAGT GCTCATTGCC ATGACGATTT AGGAATGGCT GTTTCAAATA " 9240 

GTTTAGCTGC AATTGAAGGC GGTGCGAGAC GAATTGAAGG CACTGTAAAT GGTATTGGTG 9300 
AACGAGCAGG TAATGCAGCA CTTGAAGAAG TCGCGCTTGC ACTATACGTT CGAAATGATC : 9360 

ATTATGGTGC TCAAACTGCT CTTAATCTCG AAGAAACTAA AAAAACATCG' GATTTAATTT, 9420- 

CAAGATATGC AGGTATTCGA GTGCCTAGAA ATAAAGCAAT . TGTTGGCCAA AATGCATTTA 9480 

45 GTCATGAATC AGGTATTCAC CAAGATGGCG .TATTAAAACA TCGTGAAACA TATGAAATTA 9540 

TGACACCTCA ACTTGTTGGT GTAAGCACGA CTGAACTTCC* ATTAGGAAAA TTATCTGGTA 9600 

AACACGC CTT CTCAGAGAAG TTAAAAGCAT TAGGTTATGA CATTGATAAA GAAGCGCAAA 9660 

50 TAGATTTATT TAAACAATTC AAGGCCATTG CGGACAAAAA GAAATCTGTT TCAGATAGAG 9720 

ATATTCATGC GATTATTCAA GGTTCTGAGC ATGAGCATCA AGCACTTTAT AAATTGGAAA 9780 * 
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AAGAGGGTCA 


TATTTACCAG 


GATTCAAGTA 


TTGGTACTGG 


TTCAATCGTA 


GCAATTTACA 


9900 




ATGCAGTTGA 


TCGTATTTTC 


CAGAAAGAAA 


CAGAATTAAT 


TGATTATCGT 


ATTAATTCTG 


9960 


5 


TCACTGAAGG 


TACTGATGCC 


CAAGCAGAAG 


TACATGTAAA 


TTTATTGATT 


GAAGGTAAGA 


10020 




CTGTCAATGG 


CTTTGGTATT 


GATCATGATA 


TTTTACAAGC 


CTCTTGTAAA 


GCATACGTAG 


10080 


10 


AAGCACATGC 


TAAATTTGCA 


GCTGAAAATG 


TTGAGAAGGT 


AGGTAATTAA 


TT ATGACTT A ' 


10140 


TAACATTGTT 


GCCCTACCTG 


GTGATGGAAT 


CGGTCCAGAA 


ATTTTGAACG 


GATCTCTATC 


10200 




ATTGCTTGAA 


ATTATAAGTA 


ATAAATATAA 


CTTTAATTAT 


CAAATAGAGC 


ACCACGAATT 


10260 


15 


TGGTGGTGCC 


TCTATTGATA 


CATTCGGCGA 


GCCTTTAACT 


GAGAAAACCT 


TAAATG CGTG 


10320 




TAAAAGAGCA 


GATGCTATTT 


TACTGGGTGC 


AATCGGTGGA 


CCTAAATGGA 


CAGATCCTAA 


10380 




CAATCGACCA 


GAACAAGGAT 


TATTAAAATT 


GCGTAAATCC 


TTAAATTTAT 


TTGTAAATAT 


10440 


20 


ACGCCCCACT 


ACCGTTGTCA 


AAGGCGCTAG 


TTCTTTATCA 


CCTTTAAAGG 


AAGAACGCGT 


10500 




TGAAGGCACA 


GATTTAGTTA 


TAGTCCGTGA 


ATTGACAAGT 


GGTATTTATT 


TTGGAGAACC 


10560 




,. TAGACATTTT 


AATAATCACG 


AGGCCTTAGA 


TTCTCTTACT 


TATACAAGAG 


AAGAAATAGA 


10620 


25 


ACGCATTGTT 


CACGTAGCAT 


TTAAATTGGC 


CGCTTCAAGA 


CGAGGAAAAC 


TAACATGAGT 


10680 




TGATAAAGAA 


AATGTATTAG 


CTTCTAGTAA 


ATTGTGGCGC 


AAAGTCGTAA 


ATGAAGTAAG 


10740 




TCAATTATAT 


CCAGAAGTAA 


CAGTAAATCA 


CTTATTTGTT 


GATGCTTGTA 


GTATG CATTT 


10800 


30 


AATCACAAAT 


CCAAAACAAT 


TTGACGTCAT 


CGTATGTGAA 


AACTTATTTG 


G CGATATTTT 


10860 




AAGTGATGAA 


GCTTCAGTGA 


TTCCTGGTTC 


ACTTGGTTTA 


TCACCTTCTG 


CTAGTTTTAG 


10920 


35 


TAACGATGGT 


CCAAGATTGT 


ATGAGCCTAT 


TCATGGATCA 


GCACCAGATA 


TTGCAGGTAA 


10980 


AAACGTTGCC 


AATCCATTTG 


GAATGATTCT 


ATCTTTAGCG 


ATGTGTTTAC 


GTGAAAGCTT 


11040 




AAATCAACCA 


GATGCTGCAG 


ATGAATTAGA 


ACAACATATT 


TATAGCATGA 


TTGAACATGG 


11100 


40 


GCAAACGACA 


GCAGATTTAG 


GCGGCAAATT 


GAATACTACT 


GATATTTTCG 


AAATTCTATC 


11160 




TCAAAAATTG 


AATCACTAAG 


GGGGAGATGT 


AAATGGGTCA 


AACATTATTT 


GACAAGGTGT 


11220 




GGAACAGACA 


TGTGTTATAC 


GGGAAATTGG 


GCGAACCGCA 


ACTATTATAC 


ATTGATTTAC 


11280 


45 




1 I i Av, 1 


TCTC CTCAAG 


UAL I ITjAAGij 


ACTTAGGCTT 


CAAAAGAGAA 


11340 




AATTAAGACG 


CCCAGATTTA 


ACATTTGCAA 


CACTCGATCA 


CAATGTTC CT 


ACTATTGATA 


11400 




TATTCAATAT 


TAAAGATGAA 


ATTGCAAACA 


AAGAAATCAC 


AACATTACAA 


AAAAACGCCA 


11460 


50 


TAGATTTTGG 


GGTG CATATT 


TTTGATATGG 


GTTCTGATGA 


ACAAGGTATT 


GTTCACATGG 


11520 




TAGGACCTGA 


GACAGGACTT 


ACACAGCCTG 


GCAAGAGAAT 


CGTTTGTGGT 


GACTCTCACA 


11580 



55 



606 



EP 0-786 519 A2 



10 



is 



20 



30 



35 



40 
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ATGTTTTCGC 
ATGGTACCTT 
ATGGTGTTGA 
TTTCAATGGA 
GCATAATCCA 
ACTtCGCTAA 
ATCGTGTAAT 
CTGAAATGGG 
GTGCGTATGA 
ATGTTTTTCT 
TTGTTAAAGG 
CAGTAAAAAA 
AATGG CGTGA 
GCGTACATTG 
GAACACATTT 
ACGTAAGAAA 
AAATAGTCCC 
TAAAGCGTAT 
CTGATGGTTC 
TTTTAATTAC 
TTAAGGACTA 
ATTGCACTAA 
CACAATATGT 
GTTTCCATTT 
TTGCAATCAC 
GTTGAATATT 
AAGACTTAAA 
GTATGATTGT 
AAGAGGTGCT 



AACTCAAACG . CTATGGCAAA 
ACCAACAGGC GTCTATGCTA 
CTTTGGTACA GGCTATGCTT 
TGGTCGAATG ACTATTTGTA 
ACCTGATGAT ATAACATTTG 
ATCAGTTGAT AAGTGGCGTG 
TGAACTTGAT GTTTCAACAT 
TGTTAATTTC AGTGAACCAT 
TTATATGGGG TTAGAACCAG 
CGGTTCATGT ACAAATGCTA 
AAATAAAGTT CATCCAAATA 
AGAAGCAGAA AAATTAGGTC 
ACCAGGATGT TCAATGTGTT 
TGCATCTACA AGTAATCGAA 
AGTATCGCcT GCTATGGCAG 
GGTGGTTGTT TAAATGGCAG 
TCTCTTCAAC GACAATATCG 
TTCAAAAAGT GGCTTTGGTC 
AGATAATCCT GATTTCAATC 
TGGAGATAAT TTTGGATGTG 
TGGTTTTCAT ATTATTATTG 
AAATGCGATG TTGCCTATCG 
TGAAATTGAG GTCGATTTAC 
TGAAATTGAT GAAACTTGGA 
C CTACAATAT GAATCATTAA 
ATGACAGTCA AAACAACAGT 
GATATTGTCA AAGAAACACC 
AAAGTCTATT TAAAACGAGA 
TACAACGCTA TTTCTGTTTT 



CAAAACCCAA 

AGGACATTAT 

TGGAATTTAC 

ACATGGCTAT 

AATATGTTAA 

AgCTATATTC 

TAGAACCACA 

TCCCTGAAAT 

GTCAAAAAGC 

GACTATCAGA 

TTACAGCTAT 

TAGATACTAT 

TAGGCATGAA 

ACTTTGAAGG 

CAGCAGCAGC 

CAATCAAACC 

ATACAGACCA 

CATTTGCTTT 

CTAACAAACC 

GTTCAAGTCG 

CAGGAAGTTT 

TTTTAGAAAA 

CAAATCAAAC 

AGAATAAACT 

TAGAAAAATA 

TTCTACGAAA 

TTTACAATTA 

AGATTTACAA 

ATCAGATGAA 



AAACTTAAAA 
TCTGCATTTA 
TGGCGAAACA 
CGAAGGTGGT 
AGGGAGACCA 
TGATGACGAC 
AGTGACATGG 
CAATGATATC 
TGAAGACATC 
TTTGATTGAA 
T(3TCGTACCA 
CTTTAAAAAT 
TCCTGACCAA 
ACGACAAGGC 
TATTCATGGT 
TATTACAACA 
AATCATTCCT 
TGATGAATGG 
ACAATATAAA 
TGAACATGCT 
CAGTGACATA 
AAGTGCCCGT 
TGTGTCATCA 
TGTAAATGGC 
TGAAAAATCa 
GATATCGATG 
GACCATTACT 
TGGGTACGTT 
GCTAAAAGTA 



ATCGATATTA 

ATTAAAACGT 

ATTAAAAACC- 

GCCAAATACG 

TTTGCCGATA 

GCGATATTTG 

GGAACTAATC 

AACGATCAAC 

GACTTAGGGT 

GCTAGTCATA 

GGTTCTCGTA 

GCAGGATTTG 

GTACCTGAGG 

AAAGGTGCAA 

AAATTTGTGG 

. TATAAAGGTA 

AAGGTACACT 

CGGTACTTAC 

GGGGCTTCTA 

GCTTGGGCTC 

TTTTATATGA 

GAACATCTTG 

CCAGACAAGC 

TTAGATGACA 

CTTTAAGGGA 

AGGCATTTTT 

TATCTCAAAA 

CTTTTAAATT 

AAGGTATTAC 



11700 
11760. 
11820 
11880- 
11940 
12000 
12060 
12120 
12180 
12240 
12300 
12360 
12420 
12480 
12540 
12600 
12660 
12720 
12780 
12340 
12900 
12960 
13020 
13080 
13140 
13200 
13260 
13320 
13380 
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AAACGCTGTT 


ATCTTTATGC 


CAGTCACTAC 


ACCTTTACAA 


AAGGTAAATC 


AAGTAAAGTT 


13500 




, CTTTGGAAAT 


AGTAACGTTG 


AAGTTGTACT 


CACTGGTGAT 


- ACATTTGATC 


ACTGTTTAGC 


13560 


5 


TGAAGCTTTA 


ACTTATACAA 


GTGAACATCA AATGAACTTT 


ATAGATCCAT 


TCAATAATGT 


1362 0 




TCATACAATT 


TCTGGACAAG 


GTACGCTTGC 


TAAAGAAATG 


CTAGAACAAG 


CAAAGTCTGA 


13680 


10 


CAATGTTAAC 


TTTGATTATC 


TATTTGCCGC 


AATTGGTGGT 


GGCGGTTTAA 


TTTCAGGTAT 


13740 


TAGTACTTAC 


TTTAAAACCT 


ATTCACCTAC 


CACGAAAATT 


ATAGGTGTTG 


AACCTTCAGG 


13800 




TGCAAGTAGT 


ATGTATGAAT 


CTGTTGTGGT 


AAATAATCAG 


GTAGTCAGAT 


TGCCTAATAT 


13860 


1S 


CGATAAATTT 


GTGGACGGTG 


CATCTGTAGC 


TAGAGTTGGC 


GATATTACAT 


TTGAAATTGC 


13920 


AAAAGAAAAT 


GTAGATGATT 


ACGTTCAAGT 


AGATGAAGGT 


GCAGTTTGTT 


CTACGATTTT 


13980 




AGATATGTAT 


TCAAAACAAG 


CAATTGTAGC 


AGAACCTGCT 


GGCGCATTAA 


GTGTAAGTGC 


14040 


20 


GCTTGAAAAC 


TATAAAGATC 


ATATTAAAGG 


TAAAACAGTG 


GTTTGTGTCA 


TTAGTGGTGG 


14100 




TAATAATGAT 


ATTAATCGAA 


TGAAAGAAAT 


TGAAGAACGT 


TCATTACTAT 


ACGAAGAAAT 


14160 




GAAGCATTAC 


TTTATCTTAA 


ATTTCCCTCA 


ACGTCCAGGT 


GCATTGAGAG 


AATTTGTAAA 


14220 


25 


TGACGTATTA 


GGACCTCAAG 


ACGATATTAC 


TAAATTTGAA 


TACTTAAAAA 


AATCTTCTCA 


14280 




AAATACAGGT 


ACTGTCATTA 


TTGGTATTCA 


ACTTAAAGAT 


CATGATGATT 


TAATACAACT 


14340 




CAAACAACGT 


GTAAA t CATT 


TCGATCCTTC 


CAATATTTAT 


ATTAATGAAA 


ATAAGATGTT 


14400 


30 


ATATT CATTG 


TTAATTTAAC 


ACATAGTAAG 


AAAAACAGTC 


ATAAATTGAT 


TTCTAATTGA 


14460 




AATCATCTTA 


TGACTGCTTT 


TTATTATACT 


TTACATTTCT 


GGTTTCGTCA 


GATTCAAACG 


14520 


35 


TTTTCACTrC 


GCCAAGCCAT 


CTTTCTTTGT 


GTTTGCTTTT 


aTTTTGACGT 


TTTAGACATA 


14580 


AAAAAaGAGA 


CCTTGCGGTC 


TCAATGCGGC 


TCATCGCATC 


cAcrrriTGC 


CTGGCAACGT 


14640 




TCTACTCTAG 


CGGAACGTAA 


GTTCGa CTAC 


CATCGACGCT 


AAGGAGCTTA 


ACTTCTGTGT 


14700 


40 


TCGGCATGGG 


AACAGGTGTG 


ACCTCCTTGC 


TATAGTCACC 


AGACATATGA 


ATGTAATTTA 


14760 




TACATTCAAA 


ACTAGATAGT 


AAGTAAAAGT 


GATTTTGCTT 


CGCAAAACAT 


TTATTTTGAT 


14820 




TAAGTCTTCG 


ATCGATTAGT 


ATTCGTCAGC 


TCCACATGTC 


ACCATGCTTC 


CACCTCGAAC 


14880. 


45 


CTATTAACCT 


CAT GATCTTT 


GAGGGATCTT 


ATAACCGAAG 


TTGGGAAATC 


TCATCTTGAG 


14940 




GGGGGCTTCA 


TGCTTAGATG 


CTTTCAGCAC 


TTATCC CGTC 


CACACATAGC 


TACCCAGCTA 


15000 




TGCCGTTGGC 


ACGACAACTG 


GTACACCAGA 


GGTATGTCCA 


TCCCGGTCCT 


CTCGTACTAA 


15060 


SO 


GGACAGCTCC 


TCTOUUVTTT 


CCTACGCCCA 


CGACGGATAG 


GGACCGAACT 


GTCTCACGAC 


15120 




GTTCTGAACC 


CAGCTCGCGT 


ACCGCTTTaA , 


TGGGCGAACA 


GCCCAACCCT 


TGGGACCGAC 


15180 
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GTGGAACTT 15249 
(2) INFORMATION FOR SEQ ID NO: 103: 

5 <i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 14051 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double , \ 

(D) TOPOLOGY: linear 

10 . . . . • • -• ' • 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 103 : 



15 


GTGGCAATAT 


TTCTAGTTCT 


CGTTTTGATA "AGATTTTAAA AGGATCTGTT 


VjlUi 1 X \J\^tWJ 


60 


TGTCCTGATT 


TGAATTAGAT 


ACAAATTCAT 


TCACTAAAGA 


TGTTGTAAGT 








CATATGTTTC ACGTTTATAT 


ACAGTTCGAA 


TAGCTAACAA 


TAATTGTTCA 




1 flft 
xou 


20 


TTTTCAATAT 


GTAACCTTTC 


GCACCATTAC 


GCAACACATG 


GAACAAATAC 








CAAACATTGT 


TAATATTAGT 


ATTTTAGTTT 


CAGGAAAACT 


GTCAGCAATT 


X X >iV— . X ^-vj» X r\K? 


300 




CGATAAGACC 


TGACTCACCT 


GGTGGcATAC 


TTAAATCCAT 


TAGTAACACA 




360 


25 


ATTCCATTAC 


TTTTTGGTAA 


GCTTCGACGC 


CATCTGCAGC 


CGTTGCAACA 




420 




CATTTTG AT A ATTTAAAATC 


ATAGAGAACC 


CCGTACGGAC 


AACAGCGTGA 


TCATCGGCAA . 


480 




TGACTATTTT 


CAATTTTATT 


CCCCCAATGT 


ATGTTTCAAA 


TTGGAATGTT 


CAATGTAACA 


540 


30 


TTGGTACCCT 


CACCAATTTT 


Lul X lvJviln 


TTGACGCTAC 


CGCTGACTAA 


CTCAGCTCGC 


600 




TCATTCATTC 


CATATAAACC 


GAGTCCAGAA 


CCTTTAGGCT 


TAGAACTTGG 


ATCAAAACCA . 


660 


35 


TTTCCCGCAT 


CTATCACTTC 


TGCTACCAAA 


TGGCGCCCAG 


TTTGACGGAT 


ACCTACATTT 


720 


ATTTCATTTA 


CATCAGCGTA 


TTTCAACGCA 


TTTAAAATAG CTTCTTGCAC 


TACTCGATAA 


' 730 




ACAACCGTTT 


CAATATCACT 


ATCAAAGCGA 


GTATTTTTAA 


TATTTGATGT 


ATATATGATT 


840 


40 


TTTATTCCAT 


AATTTTCTTC 


AAACTGTTTA 


AAATATGATT 


TAAAAGCTGC 


TTCAAGGCCT 


900 




AGATCATCCA 


AAGAAGCGGG 


TCTTAATTCA 


ACCGACATAT 


TACGTATATC 


ATCAATTAAT - 


960 




TTAGCGACAA 


TATATTCAAT 


ATTTTCTGCG 


TCTTCCAAAA 


GCTTAGTTGT 


ATCTTCTTGA 


1020 


45 


TATTTTAATA 


ATCTCAATTG 


AACATCTACA 


TTGAGCATTT 


CTTGAATCAC 


ACTATCATGT 


1080 




AACTCTCTAG 


AAATTCGCTT 


TCTTTCATTT 


TCTTGGGCTG 


AGATTGTTTT 


ACGCATCATA 


1140 




CGTTGTTGAT 


GCAATTTCTC 


TTGCTGTTCA 


ATTTGTGATG 


AAACATTTTG 


AAGCGTAAAT 


1200 


SO 


GCATGAATTC 


CCCTGTCTTG 


ATCAATCAAC 


TGATATGTTG CTGTAAATGG 


CATCACTTTT 


1260 




TGATCTTTCG 


TCTTCATAAA 


- TACTTGGAAA 


TTCGTAGCTT 


GTACTTGCAT 


CGATTCTAAG 


1320 
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15 



20 



25 



35 



45 



SO 



ATCGCATTCG CCACAGCACT GTAATTATCT TCTTCAGATA ATATATCTTT AGCAGCATCA 1440 

TTCATTGCAA TAATTTTACC GTT AT CATCA GCAAAAACTA TCTTTTCGAT TGAATGCTCA 1500 

TAATATTTTT TCAATAAAGT ATCTAACTGT ATACTGTCCT CATTAATCAT GACTTACACC 1560 

CTAATTCATC TCATTATTTA TCATCATTGA AAATACCAAA CTTACGTTGA ATATCATCAT 1620 

TATCAAATAT TTTTGGTAAA GGACGACCAT CTCTTTGACC AAATAATAGT ACGCCATACA 1680 

CTTGATTCTT ATACCAAAGC GGCACTGCTA AAACTGCTGT TAATGATTCG CTCAATAAAA 1740 

TTGGATAGTC AATCTTTTCT TCAGG CCCTA AAGCTAAACC AACATTGGCT ATT AC CATAC 1800 

GCTTTCCTGT TTTCATAACA GTTCCAGCTA ATCCACGACC TTTTCTTAAA ATAATCAATT 1860 

TAAATCGATT ATTTTTATTA CCTGAAACAT AGTGCCATTT TATTGGAGAT GATGGTTTGT 1920 

TAGATTCATA GAAAGCGATT GC CGCAAAAT CATAACCCTC TTCTTTGCGT ATTTTATCTA 1980 

ATGTCTCTTG AAATCTACGA TCTTCAATTA TTGCTTCTGG TGTCAAATCC TTTCACCTCT 2040 

TATG CTTACA CTTTATTCTT ACGGTAAATA ATATATCTGC GATTTATATA TGTCAAAGGT 2100 

ACACTCCAAA CATGCACCAA ACGTGTAAAT GGCCAACAAG CCATAATAGT GAAACCTAAC 2160 

AATATATGCA TTTTAAATGC AATCGGCACA CCACTCATCA ATGACGCATC TGGTTTTAAC 2220 

ATAAATAATT GTCTAAACCA AATTGATAAT GAAGTTCTGT AGTTAAAGTC TGGATGTTGT 2280 

ATATTTGTTA CTAATGTTGC GTAACATCCC ATAAATACGA TAAGTAATAA TAAGAAATTT 2340 

ACAAATATAT CCGACGCTGA ACTTAATCTT CGAATACTTT TCGTAGTAAC AGGTCTCGCT 2400 

GTTAATAAAA ACATCCCTAT CAAAGTTATT ATACCAAAGA TGCTACCAAT ATAAACAGCG 2460 

C CTAT ATG AT ATAAATGCTC AGACACACCC ACTGCATCCA TCCATGGTTT CGGTATTAAC 2520 

AATCCAACTA CGTGTCCAAA AAACACTGGA ATAATACCTA AGTGAAATAA TAAACTTCCC 2580 

CACATCAACC TTTTTCTTTC T ATTAATT CA CTAGATTTAG CTGTCCAAGA AAATTTATCA 2640 

TAACGATAAC GTGCAATATG ACCTGCGACA AAGACAACTA AACATAAATA CGGAAATATA 2700 

ACCCATAAAA ACTGATTAAG CATGATGTTT CACTCCTTTT GGTGATGtCA AACATAATTT 2760 

CAATGTTTTT CTAAGTGCTT GAATCACATA GG CAT ATGGA TTGTTATCTT CACCAAGTGC 2820 

ATTCGCCATC ACATATGTTC CATCCTCAAT AATCATAATG ATTAATTGAA TATTCTCTTC 2880 

AGCTCTTGGA TCATTTCGCC ATTCTGCCAC TTGCAAAAAT TGAAG CATCA ACGGTAGATA 2940 

ATCAGAAAGT TCATTATCTA CCATTTCTAG TCCAAACATT TCATATAATA CCTTTAATTT 3000 

AG CT AACATT TGCCCACGTT CTTTTTGCGT ATCAAATTTG TTATACGTCA TATATAATGG 3060 

TGCTTTTTTC GTAAAATCAA ATGTATCTGT ATAAATCGCT TTGATTTCTG ATAATGAAAA 3120 
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TTT PTTP A 

XV3 X X 1 x 


rUWJl XXI XVJ 


fl 71 TfZ A A 2t A fW 


TAATTTTTCT 

X nnX xx x iv»* 


GGAAAACATA 


ACTGTTGTGC 


3240 








GATATTTTTT 

\M\XnX X X X X X 


AAAATTATCG 


AAATTAATCA 


CGGAAAATCC 


3300 




CTCCATAGAA 


ATT CTCATTA 


lnnnl l XL1 1 


GACC'AGTTTT 


CGGTGAACCT 


ACTGCAACGC 


3360 




CACAGCCTTC 


ACAGTTATCT 


CCAAAATGCT 


CGCCGCCGTA 


ATTGTATCCT 


GTACTACCTT 


3420 


10 


GTGCGTGATA 


CGTATCTAAA 


TAGGTTTCTT 


TGTGTGATGT 


TGGAATAACA 


AATCGATCTT 


3480 


CATATTTGGC 


TAGTCCTAAT 


AAACGATACA 


TGTCTTTAGT 


TTGG CGCTCG 


GTTATACCTA 


3540 




ATCGCTCTAA TCGAGACGTG 


TCAAATGGCT 


GTTGAGTAAC 


TTGAGATCTC 


ATATAACTTC 


3600 


15 


TCATCATTGC 


CATACGTTGT 


AGGGCTCCTT TTACTGGCTC 


X VJ XXIX V X W X 


GCAGTGAAAA 


3660 




TATTAGCTAA 


GTATTCAATA 


GGTAAACGCA TTTCTTCAAT 


VJ\J%w X VV^wAnn 


AT CGCATCTG 

f\X WWII V* X V* 


3720 




GATTTTGAGT 


TGTATTTTTA 


CCTTCAAAAT AGCTCATAAT 


X VjljVj V_ X neVJ X 


GC3TC3GGCAAT 


3780 


20 


ACCAAACCAT 


CGGCATCGTT 




GATGTAACGG 


Ann X VJWinur X 


X XaXaX X V__rtJ"\ 


3840 




TTGCTAACTT 


ATAAATTGGA 


X X X lulw 


CAGCTTCAAT 




ivVvArt X ncwi X 


3 900' 




CTTTTTCAGC 


TTGAGCAATG 


>Vw 1 IVvl 1 X 


CAAATGGGTT 


lAAvsAAJlAln 


X \_ X nnJ. ivjl 1 


■a q £ n * 


25 


TTTCATATAA ATCTTTCTCG 


T f'TA £"""PfS f*T*fi 


AAGCTGCTTC 


A 1 bAAv, 1 l^viA 




4 020 




ATAATAAAAC 


ACCTAAGTAA 


CGCATACGTC 


CTGTACAAGT 


TTCAGAGCAT 


a c^rzT a one a 


4080 




TACCCGCCTC 


GATTCTCGGG 


AAACAGAAAG 


TACACTTTTC 


AGCTTTGTTC 


u l X X Xv.^*nnX 


4 140 


30 


* TGAAGTAAAC 


TTTCTTATAT 


GGACAACCTG 


TCATACAGTA 


ACGCCATCCA 


V-*j>*.v_~r\ x OCV? x 


4200 




CTTGGTCAAC 


TAATACAATG 


CCATCTTCAT 


CACGTTTATA 


CAT AG CAC CT 


■ r^i a a rzn a p a r*n 


4260 


35 


ATGCAACGCA 


ACTTGGATTC 


AAGCAATGTT 


CACATAAACG TGGTAAATAC 


ATPATAAAAG 


4320 


TTTCGTCAAA 


TTGGAATTTA 


ATATCTTCTT 


CTATTTTTTG 


GATGTTAGGA 


TCTTTTGGAC 

X V X X X X %7x7X%V» 


4380 




CTG'fAACATG ACCACCTGCT 


AAGTCATCTT 


CCCAGTTAGG 


TCCCCATTCA 


ATTTCAATGT 


4440 


40 


TATCCCCCGT 


AATTTCTGAA 


TACGCTCTAG 


CAACTGGCGA 


ATGCTTCCCT 


G ATTT CG CAG 


4500 




TTGTTAAATG 


TTCATAATTA 


TAGTTCCATG 


GCTCATAATA 


ATCTTTAATT 


AATGGCATAT 


4560 




CTGGGTTATA 


AAAAATTTTA 


CCTAAAGCAA 


TTTTTGAAAT 


TCTACTTCCA 


GATTTTAATT 


4620 


45 


CAAGTTTCCC 


TTT AC G ATTT 


AGTACCCAAC 


CACCTTTGTA 


GTGTTCTTGG 


' TCTTCCCAAC 


4660 




GTTTCGGATA 


CCCTACACCT 


GGC t TCGTTT 


CTACGTTGTT 


GAACCACATG 


TACTCAGCAC 


4740 




CTGGACGATT 


TGTCCaAGTG 


TTTTTACATG 


TCACACTACA 


CGTATGGCAT 


CCTATGCATT 


4800 


50 


TATCTAAATT 


TAATACCATC 


GCAAcTTGCG 


CTTTAATCTT 


CAAGCCAATT 


AACCTCCTTC 


4860 




ATCTTTCTAA 


CTGCTACATA 


TAAATCCCTT 


TGGTTCCCAA 


TTGGTCCATA 


ATAATTAAAG 


* 4920 
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GGCGCGTTGT GTGAACCACC ACGTGTATCT GTAATTTCTG ACCCAGGCGT TTGAATATGT 5040 

TTATCTTGTG CATGATACAT AAACATTGTA CCTTTAGGCA TACGATGCGA AATAACTGCT 5100 

CTTGCCGTTA CAACACCATT ACGGTTATAC ACTTCTAGCC AATCATTATC TTGGATATCG 5160 

TGTTTTTCAG CATCTTCATT TGATATCCAA ACCGTTGGAC CACCTCTAAA TAGTGTCAAC 5220 

ATATGCTTAT TATCTTGATA CATTGAGTGT ATATTCCATT TTCCATGAGG CGTTAAATAA 5280 

CGCAgfTACCA AAGCATCTGT ACCACCTTTA ATTTTCTTAT CTCTATTCCC AAATACCATT 5340 

GGCGGCAATG TCGGTTTATA TACTGGTAAG CTCTGCCCAA ATTGTTGGAA AACTTCGTGA 5400 

TCCACATAAT AACTTTGACG TCCTGTTAAT GTTCTAAAAG GTACTAGAGG TTCTATATTC 5460 

GTTGTAAATG GTGAATATCG TCGACCTTGT TTATTTGAAC CTGGGAATAC TGCTGTCGGT 5520 

ATTACTTCTC GTGGTTGTGA AGTTATATTT AAAAACGAAA TTTTCTCAGC AGCGCGTTCG 5580 

CTAGAAATAT CTTTTAACGG CATTCCAGTT TGTTCTTCGA GATCTTCATA TGATTTTTGT 5640 

GATAATTTAC CATTCGTAGC AGATGAAATA CTTAGTATTG CATCAGCTAC ATTACGTGCT 5700 

GTATCAATAC GTGGACGATT CGCTCTCACA GAATCATCAT TTGTATCACT CCACGTACCT 5760 

25 AACATACTTT TTAATTCTTC ATATTGTTCA CTGACACCGA AACTTACACC ATGTGCTCCA 5820 

ACTTTCCCTT TTTCAAGTAC AGGACCAAGC GTGACATATT TGTCGTAAAT TTTAGTGTAG 5880 

TCGCGTTCTA CAATTGCAAA GTTAGGCATT GTACGTCCAG GTACCGCTTC AATTTCACCC 5940 

TTCGACCAAT CTTTCACTAC GCCGTATGGT GTTGAAATTT CTTGCTTTGT ATCATGACTA 6000 

AGTGGAGTTG TCACAACATC TTTAAACGTT CCAGGTAAAT AGTCTTTTGC CATTTCTGAA 6060 

AATGCTTTTG CCAACGTTTT ATAAATATCC CAGTCTGAAC GCGATTCCCA TAACGGATCA 6120 

ATGGGAGGAT TGAAAGGATG TACATATGGA TGCATATCCG TTGATGATAA ATCATGTTTT 6180 

TCATACCAAG TCGCTGCCGG CAAAACAATG TCAGAATATA ACGGTGTTGC CGTCATTCTG 624 0 

AAGTCTAAAG AGACCACTAA ATCTAACTTA CCTGTTGTTT CTTCACGCCA CGTAATTTCT 63 00 

TCTGGCTTTT CATCTTCATT TGGTGTAGCT AATAACCCTG ATTTTGTGCC AAGTAAATGC 63 60 

TTCATAAAGT ATTCTTGACC TTTTGCAGAA CTTGAAATTA AGTTTGAACG CCATATAAAT 6420 

45 AATGATTTTG GATGATTCTT TTTCAAATCA GGATCTTCTA TTGCAAATTG TGTTTGTTTT 64 80 

GATTTCACTT CATCAATTGC ACGTTGCAAA ATCGCTTCAT TTGAATCTAT ACCTTCATCT 654 0 

TTAGCTTCTT CTGCAAACAA CAAACTATTT TTATTAAATT GTGGATATGA TGGTAACCAA 6600 

60 CCAAGTCTAG CTGCTAAAAC ATTATAATCA GCTGGATGTT GATGCTTTAA CTCCTCTGTT 6660 

TTAGCTAATG GAGATTTTAA ACGATCTACA TTTGACTCTT CATATTTCCA TTGGTCTGTT 6720 
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AATGCGACAG 


TACTCCATCC 


TTCAATCGGA 


CGACATTTTT 


CTTGTCCCAC 


ATAGTGAGCC 


6840 






V-J^ X X *~t\\m*£\\~\* 


TTGACAG CCA 


CATAACATAA 


CTAAGTTTAA 


GATTGAACGA 


6900 


5 


TAAATCGTAT 

XnnnX x f\x 


CTGAGTTAAA 


CCAATGGTTA 


ATACCCGCAC 


CCATGATAAT 


CATTGAACGC 


6960 




CCTTCAGTAT 


CGATAGCGTT 


TTGPGCAAAT 


TCTTTCGCTA 


CTTGAATGAC 


AACACTTTGT 


7020 


10 


TTTACGCCTG 


AAATGGCTTC 


TTGCCAAGCA 


GGTGTAT ATT 


TTGATT CTG C 


ATCGTCGTAT 


7080 


CCTTTTGATT 


CTAATTTATG 


ATCAAAACGA 


CGCACGCCAT 


ATTGACTTGC 


CATTAAGTCA 


7140 




AAAATTGTAG 


CAATACGGAC 


TTTGTCACCA 


TTTGCTAAAG 


TGACTTGTCG 


AGTTGGAATT 


7200 


15 


GGACGATTGA ATATCCCATC 


TCCATCACTA 


TCAAAGTATG 


GGAATTGAAT 


TGTTTCTAAT 


7260 




TCGTATCCAC CTTCTGTCAT TGATAATGTA GGGTTAATTT 


TAGAACCATC 


TTCTGTTTCT 


7320 




AGTTTTAAGT 


TCCACTTCTT ACCTTCTTCC 


CAACGTTGAC 


CCATTGTGCC 


ATTAGGTACT 


7380 


20 


ACTAAACTAT 


CGCTGATTGC . ATCATGAATA 


ACTGGCTTCC 


UTTfGf" 1 rTTfl 
.rv x x\^\j\~\—x x w 


CTCTGTTGTT 


7440 




TGACCTAAGT 


CACTCGCTCT 


TAAAAATCGA 


CCCGCTTTAT 






7500 




AGCATGATAA 


GAAACGGCAT 


ATCTGTATAT 


TGTTTAGCGT 


nnX X lAinfttt 




7560 


25 


GGTTGATTAA 


CATAATGTTC 


TTGTAAAATA 


ACATGCGTCA 


•i" IV!* t *' 1 " 1 *Pf5f"* 
X iuiu^ 


AATTGCAGCA 


7620 




TCTGAACCAG 


GATTCGGTGC 


TAGCCAGTTA 


TCTGCAAATT 


TCACATTTTC 


TGCGTAATCT 


7680 




GGTGCTACTG 


AAATGACTTT 


TGTACCTTTA 


TAGCGGACTT 


CAGTCATAAA 


ATGTGCATCC 


7740 


30 


GGAGTACGTG 


TTAAAGGTAC 


ATTAGAGCCC 


CACATAATAA 


TGTATGATGC 


GTTATACCAG 


7800 




TCACTTGATT 


CAGGCACATC 


TGTTTGCTCT 


■CCCCAAATTT 


GTGGAGAGGC 


AGGTGGTAAA 


7860 


35 


TCTGCATACC 


AGTCATAAAA 


ACTAAGCATT 


TCACCACCAA 


GCAAATTGAT GAATCGAGCA 


7920 


CCTGCTGCAT 


AACTAATCAT 


TGACATCGCT 


GGAATAGGTG 


TAAATCCTGC ■ 


GATTCGATCT 


7980 




GGACCAT ATT TTTTTATTGT ATACAGTAAT TGTGCTGCGA 


TTATCTCTGT 


AACGTCTTTC 


8040 


40 


CAATTTGAAC 


GCACGTGCCC 


TCCCATACCT 


CGGGCTTGCT 


TATATTGTTT 


GGCTTTGTCT 


8100 




TCATTTTCAA 


CAATAGACGC 


CCATGCAGCA ACGCGATTAC 


CATTGTTTTC 


TTCTAATGCT 


8160 




TCAGTCCATA 


AATCCCAGAG 


TTTTCCACGA 


ATATATGGAT 


ATTTGATTCG 


AAG CGGACTG 


8220 


45 


TATTCATACC 


AAGAGAATGA 


CGCACCTCGT 


GGACATCCTC 


TCGGTTCATA 


TTCAGGCATA 


8280 




TCCGGACCAC 


AACTTGGATA 


GTCAGTTTGT 


TGATTTTCCC 


AGGTAATCAC 


AC CATTTTT C 


8340 




ACAAATACTT 


TCCAAGAACA 


TGAGCCTGTA 


CAGTTAACAC 


CATGTGTTGT 


TCTTACTTCT 


8400 


50 


TTATCGTGGC 


TCCAACGTTC 


TCTGTACATT 


TTTTCCCATT 


CTCTACTTTT 


ACTTTCTAGG 


8460 




ATCGACCAAT 


TCCCATTAAA 


TTTTTCTGTT 


GGCTTAAAGA 


AATTCAATCC 


AAATTTTCCC 


8520 
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TAAAATGCCC AAGACTATTG CTTTAATTAG ATTGTACATT TTTTCACAAA CAT AAAAT AT 864 0 

TAGGGAATCA C CTAATT ACT TAAGGAATTT CCCTATCAAT AACGGGATTT CATTGAAATA 8700 

ATACACAATC ATGTATGGTC ATGCTTATTG CCAATCTAAA TCGTTCAAAT TTGGCACAAC 8760 

GACAAATAAG GCTTCAACAC GAATATATTC TCTCGGTTGA AACCTTACTT ATTCATTTAT 8820 

TTTTTATAAA TTAGTGACAT AACACTGTAT TAGCATCTGC ACGATCGGTT GAAATATATG 8880 

TTACATTTTC TTGCTGCTTA ATAAATGCAT CATAGTAATC ATATTGCGAC GAATGATATG 8 940 

TGCCATTCGA TGTATCATTT GGGTTTAGCA AACAGCCATA ACCTTCGTCA TATAAATGTT 9000 

CACAGAG CAT AAGGGCGTCA TGTTTAGAAC CACTTACTAC ATAAAATTGC TTCATAGGAT 9060 

CATATGATTT AGGAGTGTTT TCAGTATAAT CAACAACTTC CCCTATAATA CATATACCTG 9120 

GTTTCGCCTC AATTGAATAG TGTTGCAATT TTGAAATAAT ATTACTTAAA CGCCCCTTAA 9180 

CAACAAACTC GTTAAAACAC GATGCTTGAA AGACAATCGC TATCGGGTAA TCAATATCTG 9240 

TGTATTGTTG TATCTGTGTG AT AATTTTC C CTAAACGTTT TACCCCCATA TAAATTGCTA 9300 

ACGTGCCACC ATTCACTAAG GAATTGACAT CCACTTCATT TTCTTCTGAA TCTTTAAAGT 9360 

GACCTGTAGA AAATGTCACA CTTTTAGCAA CTGTACGCAT TGTCAAACCT GTCTGCATAG 9420 

TAGCAACTGc tGCGCTCGCT GATGTCACCC CTGGTACAAT TTCAAACGCA ATATGATGTT 94 80 

CATTTAGTAT GTCGACTTCT TCTTGCACAC GACCAAATAT CGCTGGATCG CCACCTTTAA 9540 

GTGTAACAAC CTTGTTATAT CGACGCGCTG CTTCCACGAT ACAGTCATTT ATTTTTTCTT 9600 

GCTGAATATG TTTTGCATAC GGCTTTTTAC CAACATCGAT AATTTCAGTA GTCAAATTCG 9660 

CATATTGTAA AATTAACGGA TTCACTAATC GATCATATAG AATGACATCC gCTTCACGTA 9720 

TTAAACGCTC AGCCTTTTTC GTCAAATAAT TCGGATTACC TGGACCCGCA CCTATCAAGT 9780 

AAACeTTGCC AT ATT C CT CT ACAGACATAT ATATACGTTC CCGTCTGTAA CTTCTACCTC 984 0 

ATAAACATCT ACACAACCTT CATCAGGTTC TTGAACAATA CCTGTATTTA AATCAATTTT 9900 

TTGATCGTGG AGCGGGCAAA ATACATATTC CCCACTCACT GTCCCTTCAG ACAATGGTCC 9960 

TTGTTTGTGT GGACAGATAT TGTGAATCGC ATGAATTTTG CCACTTTCTG TTAAAAACAA 10020 

CCCTACCTCT TTGCCTTTGA CAATAACCTT TTTTCCAATT AGGGGTGTTA ATTCATCTAT 10080 

AGTTGTCACT TTAATTTTTT CTTTTGTTTC CATGTATTAC ACCTTCTCCA CTTCAAAAAT 10140 

TCTACGTGCT TGAGCATTGC TAGTTATTGC TTCC CAAGGT TCAGCTTCGA CTGCTTTTTT 10200 

AG CATCCATA ATGCGTTCAA ATAGTTCATT TTGTCTTTCT GGGTCAAGTA AGACTTCTTT 10260 

TACATTTTCA AATCCAAGTC TTCTTAACCA TGGCGCTGTT CTTTCAGCAT ATATACCTGT 10320 
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AGTTG TTAAA AATTCAGCTT 
GAATCCATTT TCAACTGAGA 
TGGGCAGCCT GATACACCCA 
TTCTAAACGA ATGCCAAGTC 
AACACAGCTT TTAACTGAGC 
GTCTTCCCAT ATATTTGGTA 
ACCTGTCACT TTAACTAGTG 
TTGGTCTGCA TCTGTAACAC 
TTGAATATTC GCATGGTAAC 
ATGTGGATAA AC CATGTTTA 
TTTATTTTTA AAGTTTAAAA 
TATTTGCGTT ACTATTTGAT 
TCCGGCAACA AAGTCAT CTC 
TTTACCACAT GAATTCCCCG 
ATTTTCCGTA ATCGCATTTA 
TTCATCATCA G C CAT AT CAG 
TGATACAAGT GTGTAATCTT 
ACCATCATCG ATATCACCAT 
TTTTTTATAG TTATTATCAA 
TACAATTTGA CCAGCACTAT 
TGATCCCTTG TATCCGTTCG 
TTCATATAGT GGTGCAACGA 
TGCATATACA TTGCTATCAC 
ATCTAGACCT GATTCTTTGG 
TAAGTCTGCC GGAATCTCGC 
TAAGATTTCA GTTGTGTTGG 
TTTAAGCATA TTTCCAGCTT 
TAACACCGTT ACTTCCATAC 
TCCTCCACCA ATTACAATTG 



TTTCAACTTC TGTACCACGA TTACCACCGA TATAG ATTTG - 10440' 

TAATACCAAA ATCTTTAACA CCTGATTCAA " CACAACTTCT 10500 

TTTTGAATTT ATGAGGTGTA TCGATGTATT CAAATGTTTT 10560 

GTGTCGTGTA TTGCGTACCA AATCGACAAA ACTCTTTACC 10620 

GTGTTTTCTT ACCATAAGCT GATGcTGAAC GCATACCTAG 10680 

ATTCTTCTTT TTTAACTCCA TACAAACCAA CACGTTGTGA 10740 

GCACATGATA TTTCTTAGCC ACTTCTCCTA GACGAATCAG 10800 

CCCCACGCAT TTGAGGTATA ACAGAAAATG TACCATCATT 10860 

GTTCGTTAGC AAATCTTGAT TCTCTTTCAT CTTCATGATC 10920 

AATAATAGTT GATTGCTGGT CGACATTTTG GACATCCACC 10980 

CATGTCGAAC TTCTTTAGAT GTTTTTAAAC CTTTCGCTCT 11040 

CGCGTGTCAA AT CAGT ACAA C CACATAT AC CAG CAGGTTT 11100 

CTAAGGTGTG CTGCAATATT TGAGCAATTT GCGGTTTACA 11160 

CTTTTGTTTT AGCCGTTACT TCTTCAACTG TTGTAAAGCC 11220 

CTATAGTACC TTTATCAACA CCATTACAAG CACAAATTGT 11280 

CAATTGATAG CGATGCCTCT TCTCCACCTT TAGTAAGCAA 11340 

CAGTGGATTC ACCTTTTTTC ATCATGTTAT AAAAGCGTGA 11400 

ATAGTACTGC ACCAACTACA TTACCGTCTT .TTAAAAAGAT 11460 

. CACTATT AAA TATTTCAATA CCTTTAATTT CTGCATTTTC . 11520 

ACAAGTCACA CCCAGAAACT TTTAATGACG TAAATGTTGT 11580 

TTTCTTTATT TGTTAAATGA TCAGCTAATA CTTTACCTTG 11640 

GTCCATAAAC TTTGCCGTTA TGTTCTGCAC ATTCACCAAC 11700 

TTGTTTGCAT CACATCATTG ACAACAATAC CACGATTAAC 11760 

CTACTTCTGT GTATGGTCGT ATACCTACTG CCATAACAAC 11820 

GTCCATCAGC CAATTTAACA CCCTCAACAT CATCTTCTCC 11880 

CTTGCATTTC AAACTTCATA CCTTGCTTTT CTAGATCTGC 11940 

TACGGTCTAG TTGCATTT C C ATCAACCATT CAGCTAAATG 12000 

CTTGATCTAA TAAACCACGT GCACACTCTA AACCTAGTAA 12060 

CTTTCTTTTT AGTCTTAGCA ATGTTCATCA TTTGTTCAGT 12120 
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GAATGCTTTA GAACCTGTCG 
AGTAGTAACT GATTGATTTG 
GATACCATGT TCCTCATACC 
ATTTTGTAAA ATATTTGAAA 
TACOGTAAtA TCATATAAAT 
CGCCATACCG TTACCAATCA 
CCATAATATT TATTTCAAAA 
GGAATCATTA AGCTTTCTAA 
ATTGAAGGTG TGAAGTGTAT 
TTGTTAACAA GTCTTCCGTC 
TTCGAGATGC TTTCTAAATC 
GTCGGCTTGC TAATTTGCAA 
AACTTTCCAT TAATATTGCC 
GCTAATGCGT CACAAATACG 
GGCTGGCTTA CTTCTACCTT 
GGTATATCCT TGAGATAATG 
TCAACCCCAC TTTGAATCaA 
AAAAACGCAA TATCATAGTG 
AACGCTTGaT TCTGTCGTCC 
TTTACCAACC CTTTCACACG 
GATTATAATG TAAAATCAGG 
TTTTCCCTTT TTGTTAAATC 
TTTGAGCAAG CATTAATATA 
TTGGCCTAAT ATTGTTTCGT 
TAAATCG CCA TCATCATTTT 
TTTAAGTAAC CACGGATGCA 
CGTATCTCGC AAAAATGCTT 
TTCATACTCA GGATTTGTCG 
ACTTCCCCAA GGATATCTAA 



CAAAAATCAA TTTATCGTAT 
CTCTATCTAC TTCAATTACA 
ACTCATATGG ATTCATAATT 
GCATGATGCG GTTATAGTTT 
CGTTGGCGCG CTCTAATATT 
TTACTAGTTT TTGCTTTGCC 
AAAGGTATTA ATTTTTCGTT 
TCTATCGTTA ATGATTTGCT 
ATCTGTATTA ATAACCATGT 
ATATAAAAAT AATGGTACGA 
ATGTGTAAAA CTAATCTCTC 
ATTTTGAGCG CATATTTGTA 
GTGTGCAACA ACCATAACTC 
TTGTTCAATT AATCGTCTCA 
TATGTCTGGA TACCGTCGTT 
CATTGCACTA AAGATTAGCA 
CGTCGTCaTT ACCGTCTCTA 
ATGTATATCA TCTTTTACTA 
GTGCCTCATG CCATGTGCAA 
TATTGTATAC CAAATCATTT 
GAATTCCCTG ATGCCTGTAG 
AAAAAAAGCG ACCGATATAT 
TCGGTCGCTT GTAGTGTATA 
CAAAGCGCTC GGGTATCAAT 
CATGTTCGCT GTATATTTCA 
ATCTTGCAGA TGTACCTAAA 
CTTCAACATA AGTAAGTAAT 
CAAACCACCA GACAAAAGGA 
CCGTAATCGT AGATATAATT 



GATACTTCAA TACCATTTGC 12240 

GGATCATTTG TAATTAACTC 12300 

GTTTCTTCAA CTGTCATTTT 123 60 

GGATAAGGTT CTTTACCTAT 12420 

TCTTCGATTG TTCGAATGCC 12480 

ATAAAATATG CCCCTTTACT 12540 

AGTGCTTTTA TATTTTCATT 12600 

TTAAAATTGG GTCGAAGTTA 12660 

CATTCATTTG CTGCTTCACT 12720 

CAATCAATTT TTGATACCGT 12780 

CATATAGOGT TCTCGCATAT 12840 

ACTCTTCGTG TGCCTTAGTA 12900 

CAACTTGTTG TTCGTCACCT 12960 

TTAAAGGATG TGTGCCAAGT 13020 

TCATTTCATG AACGATATTC 13080 

ATGGTACAAT TTTAAAATGG 13140 

AATCCt GATG CTCACTTTCt 13200 

ATTCAGAAAT AAATGCTTCT 13260 

CAATGATATT CCCATTGACA 13320 

TGTTTTTGTG AAAAGAATCA 13380 

TCATG CAT AT TCCTTATACA 13440 

GAATCCCTAC TCAACATTTA 13500 

TTATTATCTT AAAATGGTGG 13560 

ACTTTGCGCA TGATCACACC 13620 

TAACCTCTTT TTTCATAAAT 13680 

GTAACTGCCG CTGACTTTAA 13740 

TGGCTACCAT . AGCCTTTCCC 13800 

TAACCCGAAA TACTTTTCAC 13860 

TCATCATCAA TTGTCATGAC 13920 
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CCAATCAATA CCTAGTTCTC TTAGAgGCGT AAATGCTTCA TGCATGAGTT CTTGCAATTT " 14 040 
TTCTGCATCT T 14051 
(2) INFORMATION FOR SEQ ID NO: * 104 : -, : 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1885 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 104: 

15 ' 





TAATCCTCAA 


CTTnGATTAT 


ATGGCTTGGG 


CGCATATGAA 


CTGCTTAGTT 


TAGTGTATGA 


© U 




CATTCATACA GTTCGCATGA 


CTATCATACA 


ACCTCGAATA 


GATAACTTTT 


CTACTGAAGA 


. i *> ft 


20 


GTTACCAATC TCAAGATTAC TTCAATGGGG AACCGATTTT 


GTTAAACCCT 


TAGCCAGACT 


ion 




TGCTTATAAC 


GGTGAAGGTG 


AGTTTAAAGC 


AGGTAGTCAT 


TGTAGATTCT 


GTAAGATAAA 






GCATTCATGT 


AGAACACGTG 


CAGAATACAT 


GCAAAATGTG 


CCTCAAAAGC 


CACCACATTT 


inn 


25 


GTTGAGTGAT 


GAAGAGATTG 


CAGAACTTTT 


ATATAAACTG 


CCTGATATCA 


AAAAATGGGC 


360 




TGATGAAGT A GAGAAATATG 


CGTTAGAACA 


AGCGAAAGAG 


AATGATAAAA 


CGTATCCAGG 


420 




TTGGAAGCTA 


GTCACGGGAC 


GTTCAAGGAG 


AGTGATAACT 


GATACAAAAG 


CAGTCCGAGA 


480 


30 


CAGGTTAGTT 


GAAGCGGGTT 


ATAAACCTGA AGATATTACA 


GAAACCAAGT TACTTAGCAT 


540 


\ 


TACGAATTTA 


GAAAAATTAA 


TCGGCAAAAA 


AGCATTTTCT 


AAAATTGCAG 


AAGGCTTTAT. 


600 




AGAAAAGCCG 


CAAGGTAAAT 


TAACACTTGC 


TACCGAGTCT 


GATAAACGAC 


CAGCTATAAA 


.660 


35 


GCAATCTGCT GAAGATGATT TTGACAAACT ATAAAAATTA AAAAGGACGG 


TATATAAACA 


-720 




TGAAAGCAAA AGTATTAAAT AAAACTAAAG 


TGATTACAGG 


AAAAGTAAGA 


GCATCATATG 


760 


40 


CACaTATTTT 


TGaACCTCAC 


AGTATGCAAG 


AAGGGCAAGA 


AGCAAAGTAT 


TCAATCAGTT 


840 


TAATCATTCC 


TaAATCAGAT 


ACAAGTACGA 


TAAAAGCCAT 


TGAACAAGCT 


ATAGAAGCTG * 


900 




CTAAAGAAGA 


AGGAAAAGTT 


AGTAAGTTTG 


GAGGCAAAGT 


TCCTGCAAAT 


CTGAAACTTC 


960 


45 


CATTACGTGA 


TGGAGATACT 


GAAAGAGAAG 


ATGATGTGAA 


TTATCAAGAC 


GCTTATTTTA 


1020 




■ - f 
TTAACGCATC 


AAGCAAACAA 


GCACCTGGTA 


TTATTGACCA 


AAACAAAATT 


AGATTAACGG 


1080 




ATTCTGGAAC 


TATTGTAAGT 


GGTGACTATA 


TTAGAGCTTC 


AATCAATTTA 


TTTCCATTCA 


1140 


50 


ACACAAATGG 


TAATAAGGGT 


ATCGCAGTTG 


GATTGAACAA 


CATTCAACTT 


GTAGAAAAAG 


1200 




GCGAACCTCT 


TGGCGGTGCA 


AGTGCAGCAG 


AAGATGATTT 


TGATGAATTA 


GACACTGATG 


1260 
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TTGAGGTGTC AAGAATTTGA AATTTATGAA TATAGATATT GAAACATACA GCAGTAACGA 1380 

TATTTCGAAA TGTGGTGCCT ATAAATACAC AGAAGCTGAA GATTTCGAAA TTTTAATTAT 1440 

5 AGCTTATTCG ATAGATGGTG GAGCGATTAG TGCGATTGAC ATGACTAAAG TAGATAATGA 1500 

GCCTTTCCAC GCTGATTATG AGACGTTTAA AATTGCTCTA TTTGACCCTG CTGTAAAAAA 1560 

GTATGCATTC AATGCTAATT TCGAAAGAAC TTGTCTTGCT AAACATTTTA ATAAACAGAT 1620 

10 

GCCACCTGAA GAATGGATTT GCACAATGGT TAATTCAATG CGTATTGGGT TACCTGCTTC 1680 

GCTTGATAAA GTTGGAGAAG TTTTAAGACT ACAAAGCCAA AAAGATAAAG CAGGTAAAAA 1740 

TTTAATTCGT TATTTCTCTA TACCTTGTAA ACCAACAAAA GTTAATGGAG GAAGAACrAG 1800 

15 

AAACCTACCT GAACATGATC TTGAAAAAtG GCAACAATTT ATAGATTaCT GTATTCGAGA 1860 

TGTAGAAGTA GAAATGGCGA TTGCT 1885 
2 0 (2) INFORMATION FOR SEQ ID NO: 105: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2656 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
2S (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 105: 



35 



40 



TAATCCTTAG 


TTCACTGnCA 


AATTTCAAAA 


CACCAGTTCC 


CTCTATCTGC 


ATCCATAGAA 


60 


ACTGnATGTT 


TGTGTCAATA 


ACCGGATTAT 


ATTGTGATGn 


TGTTTGTAAC 


TCGATTAAGT 


120 


TAT CATCTTT 


CGAAAAATTA 


TCTACTACCA 


TTATTCAACC 


ACCTTTCCTT 


CGAATAAACT 


180 


CCATTTACCA 


ACkCCACCAG 


TACCAAAGTT 


TCTAACTAAA 


AATTGATGTG 


CAGACGGGAA 


240 


GTTATTACGT 


CTTAATACTT 


GTGTTGTATT 


ACCTGGTGTA 


TTCGATTTTA 


CTTCTAATAT 


300 


CCAACCTGCA 


ATACCTTTAA 


AGTCTTTAGG 


AAAATCAGTA 


AATCGGTTTG 


ATTCTTCAGT 


360 


AGTGATATAG 


AAATCTAAAC 


CAACGATTTT 


TAAATCTGAT 


AATTTTGTAA 


TACTCTTAGG 


420 


GATATGTTCC 


CAATAACCGG 


CGTTTTGCGG 


GCAGAAATTC 


CATGCTC CGT 


TGTTTTTCTT 


480 


ATTGAAAATG 


TCAATGACAC 


GTTCGAATTT 


AAGCATATTT 


CTACCTGTGC 


TGTTTCTGGt 


540 


AAGTACTTGT 


CTTAGAGCAC 


CATTATAGTG 


TCCAGGCAGT 


ACATCCAAGA 


ACCACCCTGC 


600 


ATCTCTAAAC 


GCTTTCGGTA 


ACGGGAAATC 


TAATGCATTT 


TGTGTGTCTT 


Ga CGTATAGA 


660 


TATAGTAATG 


ACCAACTTCC 


GTAATATCAC 


TTAGATATGC 


TGGGTTCTGT 


ATTGGTAACG 


720 


GTTTAACACG 


TCCGCCTGAA 


TCAGTCATTG 


ATACTTGAGG 


TGCGATGTTT 


TTCAAGAATT 


780 
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TAGTTACCCC GATTAGAAGT GCTTTACGTC CTGTTTCTAG ATCGTAATAG ATATCTAGAC - 900 

CCTCAGCCTC TTGGAAATCT CCTTTAAAGT TGTTATTCAC ACCGCCTATA TCGATGCGAC 960 

5 GTTTAAATAA CAATTCTTTC GTTTTGATAT CGAAGCCTTG TAAGTAGTTA GGGTTGGCTG 1020 

TATTCGAATC ACCTGTATAC CAATATAAGA TACCTGCATC ATAAGTGATA CCTTGCATAG 1080 

GTTGTGTATC TGAAGTGTAT TCCATAGGTA TATCCATTTG ATACAATACT TTGTCTATAC 1140 

10 CTTTATCAAT ATCGTCAGCA CTTCTAACCT CAACAAAGTT CAACGAATTC TTAAGTTGTC 1200 

TTTCAGTGGG TTTATATTCA CGTCTAAAAA TCATTAAATT TTCTACCGGA TTATAAATCG 1260 

CTGACGTATA TCTGTCGTTA AATATATTCG GCATGACATC TTGCATTTCA TTACCATAAG 1320 

15 

TTATTTCTCC AGTTCTATAT TGGAAACGTA CAAACTTGTT GTTTTTGTTA CTGTCCAATA 1380 

CAGCTGAATA AATCCATAAT TCTCCATCAA TGTATCTATA CGCATTGTGT GTACCGTGAC 1440 

CGCCGTTTTT AACAAGCAAT CTATCAATAA ATTGTCCGTT GGGCTTCAAT CTAGATAACA 1500 

20 

TGTAATGATT ACCTGGACGA GCTTGCGTCA TATAAATAAT TTTCGTTCTA GGGTCTACCC 1560 

AAAATGATTG CATTACTGCA TTTGTATATG GCGATAAATC AGTGATAAAT TCCGGTTCTT 1620 

25 GCTCTTTTGG TTCGAATCGG TATTCTGTCG CTCGATATTC TTTATAGTGT TCATCTACAG 1680 

CTTTCTCAAC CTTTTTAGTG AAAACATCTA GTGTTGAATA ATCATGATAC AAACGATCTT 1740 

GCAATGTCTT ATGACCATAA CCTGTATTAT. CAACGCGCGC GTCTTTTAcT -TCGTTGATAC 1800 

30 CGTCGCCGTT ATGACCTAGT ACCATGTTGC TAAATCGACC, GTTTAAATAT GTTAAAAAGT - 1860 

CAGAGACGTT ACTTGTAACA TTTAAATGTT CAT ACTTT AT TTGTTCTCCA TCATGTGCGA 1920 

ATACCTCTTT ATTTCTGTGG TATTCAAGAG AGAAATTAAA ATCCGTCAGC ATGTCTGAAA 1980 

35 

TAAGTTTAAA GTTATACTCA TTTTCATCTA CATATCTGTA GTCAAAGACT- CTACTTAAAT . -2040 

CTGTAATTAG TTTATTACTC ATGTTTTCCT CCTTTACTAT CCATAAAACT GATmATAATT 2100 

TTTAATAAGC TCATACATAA TAACTTCATG ACCTCTTTCA TTAGGATGTA ATCCATCAGG 2160 

40 

CATGCTAGAT TTTCTAAATG CTGGATTATA TGGTTTGAAA TAATCTGTGT GATAAGCATC 2220 

ATATACTGGT ACATCCAATT GACTACAAGC CAATATCTGA GCATTGACAT AATCCTCTAA 2280 

AGTTAACCCT AGTTTGTTTT TGTCCGTATC TTTACGGCGT ATCGTTGTAC CACTCATAGG 2340 

45 

GCATTGCCTA GTAGCTGTCA TTACAAGTAT TTTTGAAGCT GGATTATTTT TCCTGATAAC 2400 

TTCAATTGCA GAACAAAAGG CGCCGTAAAA CGTTTTAGTG TCGGTTTTAT CAGTGCCTAT 2460 

50 CGGTACGCCT GCCCAATAAC CATGTAACCA GTCATCATCT GTACCTTGTA ATATGATTAG 2520 

GTCTCCTCTT ATTTGCTCTG CTTGTCTaTA AATGCTGTTT TCTaCCGCTT CTTT AC CT AT 2580 

55 
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10 



is 



CTTGCCTAAC ATTTCT J 2656 

(2) INFORMATION FOR SEQ ID NO: 106: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4854 base pairs 

(B) TYPE : nucleic acid 
CO STRANDEDNESS : double 
(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 106: 

AAAATGAGGG TTCTAGCGGA AATTACCAAA AGCGTGGTTC ATACTATGGG CAG CGTAATC 60 

GTATTTCAAA AGAAAAAACA CCTAAATGGT TAGaAAATAG AGATAAACCT AGTGAAGAAG 120 

ATTCGGCTAA AGATAATAGC GTAGATGATC AACAATTAGA GCAAGATCGA CAAGCATTTC 1B0 

20 TAGATAAATT ATCTAAAAAA TGGGAGGAGG ACAGTCAATA ATGAAGCAAT TTAAAAGTAT 240 

AATTAACACG TCGCAGGACT TTGAAAAAAG AATAGAAAAG ATAAAnCAGA AGTAATCAAT 3 00 

_ GACCCAGATG TTAAGCAATT TTTGGAAGCG CATCGAGCTG AATTmACGAA TGCTATGATT 360 

25 GATGAAGACT TAAATGTGTT ACAAGAGTAT AAAGATCAAC AAAAACATTA TGACGGTCAT 420 

AAATTTGCTG ATTGTCCAAA TTTCGTAAAG GGGCATGTGC CTGAGTTATA TGTTGATAAT . 4 80 

AACCGAATTA AAATACGCTA TTTACAATGC CCATGTAAAA TCAAGTACGA CGAAGAACGC 54 0 

30 - 

TTTGAAGCTG AGCTAATTAC ATCTCATCAT ATGCAACGAG ATACTTTAAA TGCCAAATTG 600 

AAAGATATTT ATATGAATCA T CGAGACCGT CTTGATGTAG CTATGGCAGC AGATGATATT 660 

TGTACAGCAA TAACTAATGG GGAACAAGTG AAAGGCCTTT ACCTTTATGG TCCATTTGGG 720 

3S 

ACAGGTAAAT CTTTTATTCT AGGTGCAATT GCGAATCAGC TCAAATCTAA GAAGGTACGT 780 

TCGACAATTA TTTATTTACC GGAATTTATT AGAACATTAA AAGGf GGCTT TAAAGATGGT 840 

TCTTTTGAAA AGAAATTACA TCGCGTAAGA GAAGCAAACA TTTTAATGCT TGATGATATT 900 

40 

GGGGCTGAAG AAGTGACTCC ATGGGTGAGA GATGAGGTAA TTGGACCTTT GCTACATTAT 960 

CGAATGGTTC ATGAATTACC AACATTCTTT AGTTCTAATT TTGACTATAG TGAATTGGAA 1020 

45 . CATCATTTAG CGATGACTCG TGATGGTGAA GAGAAGACTA AAGCAGCACG TATTATTGAA 1080 

CGTGTCAAAT CTTTGTCAAC ACCATACTTT TTATCAGGAG AAAATTTCAG AAACAATTGA 1140 

ATTTTAAAAT GATTGGTGTA TAATGAATAC AAATCTAAAT CGTTTAAATG ATTGAAGACA 1200 

60 AGATGATCTA ATCAATATTA CACAGAAAGC CATTGTTTGA TGAGAATATG GTTAATAAAT 1260 

TAGATGATTA CTACTTCATT TATGGTATTT GTAATGAATA CCCGGATCAA GACCGTTATC 1320 
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CTCGTCCCTT 


GTATAGGGGC 


GGGATTTTTT 


GTTTTTTTCA GACATAAATG 


TTTGTTGGTG 


1440 




T CATAAATTC 


CCTGTTTATT 


GTTAATAGGT 


TTAATGTTAA AACGATGATT 


GTTGTTCAAT 


1500 


5 


'L J rx rl AACGA 


GGTCAGATAA 


AAGTATTTAT 


AAAGCAAATA 


GGAGGGTTTA 


ACATGGAACA 


1560 




AATTAATATT 


CAATTTCCAG ATGGTAATAA AAAGGCGTTT GATAAAGGTA CTACTACTGA 


1620 


10 


AGATATAGCA 


PAATrAATTA 


GTCCTGGATT 


ACGTAAAAAA 


GCTGTTGCCG 


GCAAATTTAA 


1680 


CGGGCAACTT 




CTAAACCGCT 


TGAAACTGAT 


GGATCAATTG 


AAATTGTGAC 


1740 




ACCAGGTAGT 


fZ IV 21 f3 & a fycfST 
UAnUnciy v—w J. 


TAGAGGTATT ACGTCATTCT 


ACTGCACATT 


TAATGGCACA 


1800 


15 


CGCGATTAAA 


Auul lAlnlu 


GTAATGTTAA ATTTGGTGTA GGTCCTGTAA 


TAGAAGGTGG 


1860 




ATTCTACTAT 




TTGACCAAAA 


CATCTCATCT 


GATGACTTTG 


AACAAATTGA 


1920 




AAAAACAATG 




TTAACGAAAA 


TATGAAAATC 


GAACGAAAAG 


TGGTTTCACG 


1980 


20 


AGATGAAGTG 


AAAGAGl 1 AT 


TCAGCAATGA 


TGAATACAAA 


TTAGAATTAA 


TCGACGCGAT 


204 0 




TCCTGAAGAT 


GAAAATGTAA 


CATTATATAG 


TCAAGGTGAT 


TTTACTGATT 


TATGTCGTGG 






AGTTCACGTT 


CCATCAACAG 


CTAAAATTAA 


AGAGTTTAAA 


CTATTATCTA 


CAGCAGGTGC 




25 


ATACTGGCGT 


GGAGATAGTA 


ACAACAAAAT 


GTTACAACGT 


ATATACGGTA 


CTGCTTTCTT 






TGATAAAAAA 


GAATTGAAAG 


CACATTTACA 


AATGTTAGAA 


GAGCGTAAAG 


AACGTGATCA 






TCGTAAAATT 


GGTAAAGAGT 


TAGAACTATT 


CACAAATAGC 


CAATTAGTTG 


GTGCTGGTTT 


*• o *% yj 


30 


GCCATTATGG 


TTACCTAACG 


GTGGAACAAT 


TAGACGTGAA 


ATTGAACGTT " 


ACATTGTTGA 


2400 




TAAAGAAGTT 


AGCATGGGAT 


ATGACCACGT 


TTATACACCA GTACTTGCTA ATGTTGATTT 


2460 


35 


ATACAAAACA 


TCTGGTCACT 


GGGATCACTA 


TCAAGAAGAT 


ATGTTCCCAC 


CAATGCAGTT 


2520 


AGATGAAACT 


GAATCTATGG 


TATTACGTCC 


AATGAACTGT 


fc CCACATCATA 


TGATGATTTA 


2580 




tgcqAataaa CCACATTCAT ATCGTGAATT ACCTATCCGT 


ATCGCTGAGC 


TAGGAACGAT 


2640 


40 


GCATAGATAT 


GAAGCAAGTG 


GTGCTGTATC 


AGGATTACAA 


CGTGTTCGTG 


GTATGACTTT . 


2700 




AAATGATTCA 


CATATCTTTG 


TTCGACCTGA 


TCAAATTAAA 


GAAGAATTCA 


AACGCGTTGT 


2760 




aaacatgatt 


ATTGATGTGT 


ATAAAGACTT 


TGGTTTCGAG 


GATTATAGCT 


TTAGATTAAG 


2820 


45 


ttatagagac 


CCTGAAGATA 


AAGAAAAGTA 


CTTTGATGAT 


GATGATATGT 


GGAATAAAGC 


2880 




tgaaaatatg 


CTTAAAGAGG 


CAGCGGATGA 


GCTTGGGTTA TCGTACGAnG AAgCGATTGG 


2940 




TGAAgCGGCA 


TTCTATGGTC 


CGAAACTAGA 


TGTTCAAGTT 


AAAACAGCGA 


TGGGTAAAGA 


3000 


SO 


AGAGACATTA 


TCAACAGCAC 


AACTTGATTT 


CTTATTACCA 


GAACGTTTTG 


ATTTAACTTA 


3060 




TATTGGTCAA 


GATGGTGAAC 


ATCATCGTCC 


AGTTGTTATT 


CATCGTGGTG 


TTGTATCAAC 


3120 
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AGCGCCAAAA CAAGTTCAAA TCATTCCAGT TAACGTTGAT TTACATTATG ATTATGCGCG 324 0 

CCAATTACAA GATGAATTGA AATCTCAAGG CGTTCGTGTA AGTATTGATG ACCGTAATGA 3300 

5 AAAAATGGGT TATAAAATCA GAGAAGCTCA AATGCAAAAA ATACCTTATC AAATCGTAGT 3360 

TGGGGATAAG GAAGTTGAAA ATAATCAAGT GAATGTGCGT CAATATGGAT CGCAAGACCA 3420 

AGAAACAGTT GAAAAAGATG AATTTATCTG GAATCTAGTT GATGAAATTC GTTTGAAAAA 3480 

10 

ACATAGATAG ACAGTTGTCG CAATAAAATG CTTTAAAACT TTTATTGCGT ATCAAGTTTT 3540 

ACAGGGTTGA TTATGCGTGA TGAATCCTGT ATATTACAAG TTAGTTAAAA TATTAAATTG 3600 

15 AGTTAGAGGT TGCATGTTTA ATTAGTAACT TGTCAGAAGT ATTTATGGTA CATAAGTTGA 3660 

ACAAGTGAAA GGTAAAGATG CCGAAATAGA TATAAACCAT AAATTATATC TATTGGGACA 3720 

GTTTTCGAAT AGGAACTGTA CTGTCACAGA ATGTGATGTG CTACCTTATA TAGATAATTG 3780 

20 CCAAAGTGGT TGCATATCTT AAAGGTATGT AGCCACTTTT TTACTTTTAA TAfCACTATG 3840 

TTCTGTAAAA AAGGGTATGA AAGTGAATAA AGGTTATTTA TTTCTTGGCC TCTAAAACAT 3900 

GGAAAGGGAG CTTATATGTC AAAAGTTCAA AATGAAAGTA ACAATGTTGT CAAAAGGGGA 3960 

25 CTTAAAGATC GTCATATTTC TATGATTGCG ATTGGGGGTT GTATTGGTAC AGGTTTATTT 4 020 

GTAACTTCTG GTGGAGCAAT TCATGATGCA GGTGCTTTGG GTGCATTAAT AGGATACGCA 4 080 

ATTA.TOGGAA TAATGGTATT TTTCTTAATG ACGTCACTTG GCGAAATGGC TACGTATTTG 414 0 

30 

CCAGTATCAG G TTCATTT AG TACATATGCT ACAAGATTTG TTGATCCATC TTTAGGGTTT 42 00 

GCGCTTGGTT GGAACTATTG GTTTAACTGG GTAGTGACTG TAG CAGCAGA TATTACGATT 4260 

GCAGCACAAG TCATTCAATA TTGGACACCA TTGCAAGGCA TAC CCGCTTG GGCATGGAGT 4 320 

3S 

GCGTTGTTCT TAGTTATAAT TTTTAGTCTG AATTCGTTAT CAGTTCGCGT CTATGGTGAA . 43 80 

AGTtjAATACT GGTTGGCATT GATAAAAGTG GTTACAGTTA TTGTfTTCAT TGCAATTGGT . 444 0 

TTATTAACGA TTGTCGGAAT CATGGGTGGT CATGTTGTAG GATTCGAAAT ATTTAATAAA 450 0 

40 

GGTGAAGGTC CAATTCTTGG TGGCAACTTA GGAGGAAGTT TGTTATCAAT TCTAGGTGTA 4560 

TTCTTAATCG CTGGTTTCTC ATTCCAAGGT ACTGAGTTAA TTGGTATTAC GGCTGGTGAA 4620 

45 TCAGAAAATC CTGAACGTGC TGTGCCGAAA GCAATTAAAC AAGTATTCTG GAGAATTTTA 4680 

TTATTTTACA TTTTAGCCAT TTTTGTTATC GGTATGTTAA TTCCTTATGA TAGTAGTGCA 474 0 

TTAATGGGGG GTAGTGATAA TGTAGCAACG TCTCCATTCA CATTAGTGTT TAAAAATGCT 4800 

60 GGATTTGCGT TTGCAGCATC ATTTATGAAT GCAGTCATTT TAACGTCTGT GTTA 4854 
(2) INFORMATION FOR SEQ ID NO: 107: 

55 
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(A) LENGTH: 2488 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 107: 



10 


ATCAAAAATT 


GATTGTTTTC 


nATTTTTTGT 


TTCAGCGCGG 


GATCTTTTAC 


GT CTTTTGTG 


60 




AAAACGaTTT 


TATTATTAAC 


TACTTTTACT 


GGATAAGTTT 


TGTATGTCGA 


GTCAGTAGCA 


120 




TTTTTTCTAT 


CGTTTGTAGT 


TGTGTCATAT TCACCAgTTA TTTTATGTGT 


GTTCTTATCT 


180 


15 


ACCTTTAACA ACATACGGTC 


TTCTTTTAAA AGCTCATCTG ATCCAACAAC 


TGAATAAGAG 


240 




GATTCTATAT 


ACCATGTGTC 


TTGATCATTA 


TTTTCATAAT 


GGGGATTATC 


GTGACCATCA 


300 




ATTTCATAAA 


GCGTTTCTAA 


gtttttaata 


GGATACGTAC 


TTAGTACTTT 


TTTAAGACCA 


360 


20 


TCTTTCAAAT 


GAATTTGTTC 


CCACTTCATT 


GCCAAAAACA 


TATCGCCACT 


GACTACAATT 


420 




GAAATAATAA 


TAATTGCTGC 


TAAGTTTAAC 


CAGAAAATTT 


TATGTGCTTT 


CATACATTCC 


480 


25 


CACCGTTTCT 


CAAAATACTT 


CATTAACACT 


ATAATAATAT 


ATTTTGAAAA 


ATATTTACAT 


540 


CAGTATTAAA 


GTGAATATCA 


AATTTTAAAT 


TTATGAAAAT 


AATAGATATT 


TATAAAAAGC 


600 




GGAAAAGAGA 


TACAATAAAA 


AACTGCATGA 


CGTTTGAGAC 


GTCACACAGT 


GTAACTAAAA 


660 


30 


ATTTAAAAAG 


. TTGTTGCTAA 


TTTTTCAGCA 


TTATTAATAC 


TAGTTGCTTT 


AATTTCTTCA 


720 


GTCTTATGAG 


GTTCAGCATT 


GTGTCCTTCA 


ATAATGATTG 


TTTCATATGA 


TGGCACACCT 


780 




AAGAATGTCA 


T AATTGTT CT 


TAAATAACGG 


TCACCCATTT 


CAAAATCAGC 


AGCAGGTCCT 


840 


35 


TCAGTATAAT 


ATCCACCACG 


TGATTGAATG 


TGTAATACTT 


TTTTGTCAGT 


TAGTAAACCT 


900 




TGTGGTCCTT 


CAGCAGAATA 


TTTAAAAGTT 


TTACCTGCAA 


TTGAAATAGC 


ATCAATATAT 


960 




GCTTTAACTA 


CAGGTGGGAA 


AGAAAGGTTC 


CACATAGGCG 


TTACAAATAC 


ATATTTATCT 


1020 


40 


GCACTTAAAA 


ATTCTTCTAA 


AATGTCACTC 


AATCTTGAAA 


CTTTCATTTG 


TTCATCATCA 


1080 




GTTAACGTTT 


CGCCATTACT 


CATTTTTCCC 


CAACCAGTTA 


ATACATCTTT 


GTCAATAACT 


1140 




GGAATATAAG 


TTTCArATAA 


ATCAATATGT 


TTCACTTCAT 


CATCAGGATG 


TTGTTGTTGA 


1200 


45 


TATGTTTCGA 


TAAATGCTTT 


ACCAGCCGCC 


ATAGAATTTG 


ATACCAGTTC 


ATTAAAAGGG 


1260 




TGTGCTGTAA 


TATATAATAC 


TTTTGCCATT 


TGAAAATTCT 


CCTCTGkTTC 


TGTTATTTTC 


1320 




TTAAGTATAA 


TTATTATACT 


CGATATAAAA 


TTTAATATCA 


ATCAAAATAT 


TCAAATTACC 


1380 


50 


ATCATTTTCT 


TCATCTATAT 


nTGGCAGTAC 


TACTAAAGTA 


TGAGTGCATT 


TAATTATGAa 


1440 




ATAGTTGATT 


TaGAATAtAT 


ACTTAATACC 


CAAAATATAT 


GAAGGATGGA 


TGCCACTATG 


1500 
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ATTATTTATA TAGATGACAT TCAAAAATGG TTTAACCAAT ATACCGATAA ATTGACACAA 1620 

AATCATAAAG GACAAGGACA CTCAAAATGG GAAGACTTTT TTAGAGGGAG TCGGATTACT 1680 

GAGACTTTTG GTAAATATCA ACATTCACCA TTTGATGGTA AG CATT ATGG CATTGATTTT 1740 

GCATTGCCAA AAGGTACACC AATTAAAGCG CCGACGAATG GTAAAGTAAC ACGTATCTTT 1800 

AATAATGAAT TGGGCGGCAA GGTATTACAG ATTGCCGAAG ACAATGGAGA ATATCACCAG 1860 

TGGTATCTAG ACTTAGACAA ATATAATGTC AAAGTAGGTG ATCGAGTCAA AGCAGGTGAT 1920 

ATTATTGCAT ATTCAGGCAA TACAGGTATA CAAACGACAG GCGCACATTT ACATTTTCAA 1980 

75 AGAATGAAGG GTGGCGTAGG TAATGCATAT GCAGAAGATC CAAAACCGTT TATCGATCAG 2040 

TTACCTGATG GGGAACGTAG CGTATATGAT TTGTAGTTAT AGAAGGGTGC CCGCAGTCTA 2100 

AAAAATTAAG CAATCATTGT GTGAGTATGA TACTTACATA ATGGTTGCTT TTTTCAATGA 2160 

AAATCGTAAT GCTAAGTCAT ACTTGTTTGA TTTAGATATT ACTTAAAATG TAAGACAAGG 2220 

TTGTTAGCAT TGGCAGTGAA ATATCGCACA TAAAAAACAT TATTGTCACA CTAGAAAATA 2280 

GTTGTGCACT ATATCAATTT TCTGTATAAA AGTTTAATTC TGACAGTAAT GTAAACGTTT 234 0 

ACAATTTATG ATTGACATTA ATAATGACTG AATATATGAT TTATGTAAGT ATTTGTGCAA 24 00 

CGTTTTCACA AAGTGTATTG CACaAyCAAA CTGtAAACaA aGTATGGGGg GCCATAACAT 2460 

GGCAGAACTA AGTTAGAGCn TATTAAAA 24 88 
(2) INFORMATION FOR SEQ ID NO: 108: 



20 



25 



30 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4 093 base pairs 
3S - (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



40 



45 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 108: 

TTTTCTTTAT TTCAAmCTGT ATATTaATGA TGTCACTTCA TTTGATACGA TTCTTGATAA 60 

CCTATTCAAA ATTCCGCCAA ATAACATAAA TATTATATAA ATGCCGATAC TTTTAATCAT 120 

TTTCTACTTT TTCTTCGATA CGGAAACTTG TTTTCGAATT GAACACTTCA CCAGCTTTTA 180 

AAATTGACGG TGCTTTTTCA CCATATAAAT TAATATCATT TGGTAAAAAT TGTGTTTCTA 240 

AT GTAAAGCC AGAATGTGGT TT ATAAAT AT TAAATGGACT ATCCCACTCA TCAGGCTGGT 3 00 

TAAAAGTAAA GAACACAACA TGAGGCATAT CTGTATCGAC CTCTAACATA AATTCATGAT 36 0 

TTTCAACATA CATTTTATGT TCACCAACTG TAAATGGGTG ATCGAGACCA CCAAAACGTG 420 
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TATCTTCAAA CACTTCATGT AAATCTAGAA TATCACCTGT 


AACAATATTT 


CGCTCATCTA 


'540 




ATACATACAT ATCTAATTGA 


TTACTTGAAA TGCGATGATT ATCAACGACA 


TTATTATCTC 


600 


5 


GATTCAAATT GAAGTACACA TGATTCGTAG GACTAAACAA TGTGTCTTCT 


GATGCAACTG 


660 




CTTCGTATTC AATCGACCAT 


TGGTGATCCG CATCATAAAT 


ATGTGTAATC 


GTCACATCGA 


720 


10 


TATCACCCGG GAAATGATCA 


TCAGCTGATT TCAACACCGT 


CTTAAATATA ACTTTAATTT 


780 




GAGCAATTTC ATTTCTAATT 


TCATAATCAA ATAACTTATT 


GTCCAAACCA 


TGACATCCAC 


840 




CATGTAAATG ATGTTCACCG 


TTGTTTTTTT CTAACTGATA TTCTTTACCT TTCAACTTAA 


900 


1S 


ATTTAGCATT ATCAATTCTA 


CCGCTATATC TTCCTATAGA 


AGCACCAAAT 


TTAAAAGGAT 


960 




TACTATGATa AAATTCATCC 


GCTTCAACAA CATTTCCAAG 


AACAATATTA 


TTATCATGAT 


1020 




ATTTCCAAGA CACTACTCTT 


GCTCCATAAT TCGTAAAAAT 


AATTTTAGTT 


TCATCATTAT 


1080 


20 


CAATTTTGAT TAAATCTACA 


CCTTGTCTTT GGTGCTCAAC 


TTCAACTATC 


ATTTTTACTT 


1140 




PTCCCTTCTA ACCACAAGTG 


TTCAAGCTCT GCTGGGTAGC 


AACATTACTA 


AAACACCTAC 


1200 




AATACAAATG ATTGCACCGA 


TAACATCATA TTTATCTGGC 


ATTTGTTTAT 


CTACGACCAT 


1260 




CGCAAAAATC AAACTCATGA 


TGATAAATAC GCCACCATAT 


GCTGCATATA 


CTCTTCCGAA 


1320 




TGATGGAAAT GATTGAAATG 


TCGCAATGAC ACCATATAAC 


ATGAGTATCG 


CACCGCCTAT 


1380 


30 


TAGCCCAACA AGTGAAGACT 


GTCCTTCCGT AAGCCACAGC 


CAAATCAGGT ATCCCCCACC 


1440 




TATTTCACAT AAGCCAGCTA 


ATATAAATAT AAAAATCGGA 


T AT AACATGA 


AATCACTCCA 


1500 




TCACACATTT GCTATCAATA 


ATCTATCGGC TACATATCAT^ TTGTTTACAT 


TTCTTCTTAC 


1560 


35 


TTCACATTCC CATTTTAAAA 


AGTTCGTTTT CACATTCATA 


TTGTACACTT 


TTTTAGACAT 


1620 




TATTCTATAG CTAAATATAA 


AAAAATAAGA GTAACACGCT 


TTCATCATCA 


TTTTATATGA 


1680 




TAAATGTGTG TCACTCTCAT 


CAATTTTATT TTTTAAATAC 


ACGTTTCATT 


GAATTAAATA 


1740 


40 


AGCCACGTTC AAATGTAAGT 


ACTGAATCTT TATATGTTTT 


AATTGCAATC 


CATATCAAGA 


1800 




CAGCTACCAT TACAATTGAG 


ATTAAAGAAC TTAAGATGAC 


CTCATATATT 


TGAAGCCCTG 


1860 


45 


AAGTTTGAGC GCGTACAACT AATTGAAATG GCGCTAAAAA 


CGGAATATAA 


CTTGTGATTA 


1920 




AAGCAAGTTG TC CATCAGGA 


TTATTTATCG TGAATATCGC 


GATATAAAAT 


GCAATCATAC 


1980 




CAAGTAATGT CAGTGGCATC 


AAAGATTGAT TTAAATCTTC 


TATTCTAGAT 


GTTAATGATC 


2040 


SO 


CGAGGATGGC TGCAAGTAAT 


ACATACGCCG TAATTCCAAC 


AATACTACTT 


ATAATTCCGA 


2100 




CAATAATAAT TTGCCAAGAC 


AATTGATTCA TTTCCACGTT 


AAAACCTTGT 


AGCAAGTCTT 


2160 




TTAAGTCAAA GGCAAAAATG 


CATATAACTG CCATCAATAC 


AATTAAAATA 


ATCTGAGTCA 


2220 



55 



625 



TAATAATCAT TTCAATGACA CGCGATGTTT 
ATGCATAATT TAAAACAATG AAGAACATTA 
5 TGAAAATCTT TTGTCCTTCT GATACTTTAT 

CAACTTTACT TTGTGCTTGT AATTTTTGTA 
CTACCATATT TGTTTGAATA GCTGTAAGCA 

10 

TTACTCGCTT CTCACTAATG ATTGTCCCTT 
TATAAGCTTT AT CAAGTTTA TGTTTTTTTA 

1S TAGTAAACTT AGCATCACTA TGAAATGTAT 

GTTCATTCGG TGCTGCTACA CCAATTTTAT 
TATCAATGTT AGATAGGCCA ATCATTAAGG 

20 ATTTAGCTTT AATTTTTTTG ATATATGTCA 

TTGCCACCAA CCTTCTCAAT GAATATATCT 
TTAACATAAC CTTGATGTGC CACAACTTGA 

25 

ATCGTCAACT GAAGACCTTG CTTCATGTTT 
AAATCTGGTA GTGTTGTTTC TGATTCAATG 
AGATGATTGA TATCACCAGA AACAACAAGT 

30 

CATAATTCTT CAACATGCTC CATACGGTGA 
TTTAAGTCTT TAACTGCTTc TTTTAATAAC 
35 GGCTCATCTA ATATTAGTAA TTCTGGTTTA 

TGTTGATTCC CTTTTGATAG ACTATCAATT 
CGCTCAAGCC AATACGATAT TTGCTGTTGT 

40 ' - ■ 

GCCAAATATT TCAATTCTTC TTCAACTGTC 
AAATAACCAA TACGATTGTA CATTGTTTTA 
CCTTCAGTTG GTTCACTTAA GCCTAAAATC 

45 

TTTCTTCCTA GAAAACCTAA CATTTTACCT 
GCCGTCATCT TGCCAAAACG TTTCGTAACA 
50 CTAAAAAnAT ATGTATTTAT CTTAATATAA 

TAAAATGAAT TTATTTTTAA AATTTCTGAA 
ATGTTAAGTA TCATTAGCAC TAGATATGTT 

55 



0 786 519 A2 

TCTCACTAGC AATTTCCATA GCTATTTGAG 2340 

GAAAGATAAT GCCATmaGcT AAAGCATAGT 2400 

CGACTTCATC ATTAGAAATC ACCTTATTAT 2460 

AGTCTTCTTT GTTGATATTT AATTCCCCGG 2520 

GTGCTTGTAC TTTTTGTGAA TCTTCATGAC 2580 

GTAACGTGCG ATTTTGATTC ACCTTGATAA 264 0 

CTTCTTTTTC AGCATCTTCT ATAGAAACTT 2700 

TCGCCTGTTG CTTGAAAACC TTATAGATTT 2760 

CTGGACCATC ATCAAACATG TTAATAATCT 2820 

CAGCAATAAT AATCATAAAA ATTACAAATG 2880 

AAGTAAATGT CGCCCAAAAC TTATGCATCC 2940 

TGTAATGATG GTTCTACAAC TTGGAATCGT 3000 

TAAATATCTT TGGCTACGTC TTCATTCTCA 3060 

TCACTATGAA TGATGCCTCT AATGTTTGTT 3120 

ACAACTTTCT TGTTACCATT AGATGCACGT 3180 

TGACCTTTAT GTAAAATACA AACATCATCA 3240 

GAACTATAAA CGATTGTACT GCCCGAATCA 3300 

TCAACATTAA CTGGGTCTAG ACCACTGAAA 3360 

TGTAACATAC TTGCTAACAG CTGAATTTTT 3420 

CGTTTTTTGC GGTTTTCAGT AATATCAAAA 34 80 

ATTTCTGTTT TTGACATTCC CTTTAAAGTT 354 0 

AATTTCCCAT GTAAACCGCG TTCTTCCGGT 3600 

TCTAGTTTTT TACCGTTATA CGTrrTGTGT 3660 

ATACGAAATG TCGTTGTTTT ACmTGCACCA 3720 

GATTCTAACT TTAATGAAAT ATCATTTACT 3780 

TGTTCAATTA CAAGTCCCAT ACTTTGCCTC 3 840 

CATTTCCATT CTCTATAAAT GCAATATTTT 3 900 

ATTGAAAAAT TTAAATAGTG CCATTTTTGC 3 960 

TTTTCCATGC CTTTATTGCC TTATTTGTAA 4 020 



626 
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CTTnCCGGTG TTT 

(2) INFORMATION FOR SEQ ID NO: 109: 

5 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 17846 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

10 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 109: 



15 


TGCCAAACTA CCTTTTGACA 


GTCGTTGCTG 


TACTTCAGGA 


TGATCAATCA 


CATATnTTAC 


60 




TTTATCAAAT AGGGCATCTT 


CATCATTTTT 


AGTAATTAAA 


TAACCATTGA 


AATCTGAAGT 


120 




AATCAGTTCG TTAGGTCCAT 


ATTTAATATC 


ATAACTAATA 


ACTGGAACAC 


CATGTGCTAA 


180 


20 


AGATTCAAGT AGCGCTAAAG AGAAACCTTC 


CATGTTACTT 


GTTATTAAAC 


TCAAATAGGC 


240 




ATCGCTATAT TCTTGGTCTA GATTGCTTAA AAAGCCGCGT AAGTAAACAT 


GATTTTCCAA 


300 




T C CAT ATTTT TGTATCAATT 


CATTTAATTT 


TTTACTTTCA 


GAaCCAAAAC 


CATACATATG 


■360 


25 


AaGCTCTATT TTTGGGACAT 


ACGATACTAA 


GCGTTTAATT 


AATTCAATTT 


GTTGATGTAA 


420 




TTGTTTTTCA GGTGAATAAC 


GAGCAACGGA 


AATTAATTTA 


ACACTGCGCT 


GATCTAATGT 


480 


30 


TTGGACTGGT GTATCAATTG 


TTTCACTATA 


GCCGACAGGA 


ATATTAACAA 


CTGGAATAGT 


540 


ATGGTTAATA CGTTTTTCAA 


CATCTAATTT 


TTGCTGCTCA 


GTAGAAACGA 


TAATTGCACG 


600 




ATATCGAGAT AAATTTTCAA ACATCGCTTT ATATACATTT 


TTAAATGGCG 


ATGAATCTAA 


660 


35 


TGCATCAATA TTTTTAATGT 


GTGTACTGTG 


AAGCACAGCT 


ACTACTGGGA 


TTGACTCAGG 


720 




CGTTAAGTTG AAAATAGGTG 


CTGTGTACAC 


ATTACGATCA 


CTGAAAAATA 


AATCCCCATG 


780 




TTGATATAGT TGTTTAATGA 


AAAATGCGCC 


TAATTCCGTT 


TCATTATTAA 


AGAAATATTG 


840 


40 


TTTGTTAGCA TAGTAAACAA 


TAATTTTTTG 


TACTTCTGGT 


TTGCCATCCT 


TGTAAGAAAA 


900 




AT ACTTTT CT AATTTTGTGT 


CACCTTCTGG 


ATTATAGAAA 


AATTCACATA 


ATGTTTGTTG 


960 


45 


TTTATCAACA AGAATCCTAC 


TACAACTTAA AAAGCCACGC 


ACATCATAAA 


AATCACGTTT 


1020 


TACTTtTCGT CTTTGACTAT 


CAAAATGATT 


TACATAATCT 


AATATACGAT 


ATTTAGGATC 


1080 




TTGAAAATGG G CAT ACATTA 


AGAAACGCTC 


TTGATCATAT 


ATTCTAAAGT 


CATGACTATT 


1140 


50 


TTCAACATGT TTTAAAGTAT 


AATGACATTC 


ATCAGTCCAA 


TACGACAACC 


AGTCAAATGG 


1200 




TTCATTGCGT TCTAAATATG 


TTGCTTCTTG 


GAAGAAATCA 


TACATATTAA 


TATAGTCAGA 


1260 




ACTAGTAATA TAATTTTGGG 


CATTTCTATA 


TAAATATCTA 


TTCCATGACA 


GAAATACACA 


1320 



55 
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CCCAGTTAAA TTAACAC CTA AACTATTACC 
TATCTATTTT TTATAATTAT ATGACATAAT 
5 GTTTATTTAT AAAACAACAA ATTTTGATAT 

GACCcAATAT ATCATkGTAG AGCTTAGGAT 
GAgGATTTAT AAArGAGATA TACAACTCTA 

10 

TACGCGTTTG AATTAATCAT ATGATATTAT 
TGTTGATGGA TAGACTCTTC ATTACGACAT 

1S TCAACTAAGT CCGCGGCAAT TAAACGAATT 

GCACGCTCTG TCACACGTTT TTCATCAGGA 
GGATTAGGTT CCATTGCATC TAAAATTTTA 

20 TTATTAATAT ATGTTTTAAC AGTGACAACA 

ATTTCTTTTG AACAAGGGCA TAGCGTTGTG 

GTAnCTTTAT CACCGTCAAT TGCTAATCCA 

25 

ATATTTGTGG TTGGACTATA GCGATCAAAG 

GCATTTTGTT TCATATTCGT TTGTAAAGTG 

• AGTTCAATAC CATTATCATA GTGCTTTTCA 

30 

CCTTTTTCGT CTTTTGTTAA ACTTGTTGAA 
TCAACAAGTA CAGGGTACAC TAAGTTTTTA 

3S TCTTTATGTG TACTTTGTAA ATCTGTCATT 

ATAGGATCTA CGGAACCAAA GTGTTTCCAA 
GTCATTTTTT TCCTCCGTTA AGATTTAAAG 

40 AAGCTGTGTT GTTf ACCATC GATTTCAGGA 

TGAGAAGCAT GTGCTTCAAA TGCCTTAATT 
TGAATATCAG GTTCTCCAAG AGCTTCX3GTT 

45 

CGAGGGCGTT CTTCTTTAGG CATGGGTTCA 
TCGTGATCAG GATGTACTGC ATATCCAGGA 
TCATCGATTA AAGATTTAAT CATACCATCT 

50 

TTGTCACGTA AACCCATTTT TCTTAAATCA 
AGTTCACGCT CACGAATACT TGGTAATGAT 

55 



TACAAAATAA TTCATTTACA ACACCACTTA 144 0 

ATTTAATTAC TTCTTTTAAC TGGAAGATGT 1500 

TTATAATGAT AGTAGTTATT CAATCAcTAC 1560 

AtTGATTTAT GACTCAGGCA CATCAAATGa 1620 

GAAGGTATAA TAAAAACGCG CAACTAATGT 1680 

TTGCGATACT TTAATTTAGC GAAAgcATCA 174 0 

TCGATATCGA AACCGTCTAA CCAATCAAAT 1800 

AAGTCTTCGA CAAAACGTGG ATTTTCATAT 1860 

CGTTTTAAAA TAGGGTATAG AATTGAACTT 1920 

TTTTTATAGT CATCAACTAT GTCTTGATCT 1980 

CCACGTTGGT TGTGCGCTGA ATACTCACTT 2040 

ACAGTTGCTT CAATAGTAAG TTCTTTACGT 2100 

TAAGTGACAT CGGCATTACC AACTGCTTTA 2160 

AACCATTTCC CAGAAACATC AACGCCTGCC 2220 

CGTAACACCT GATAAAGTGT ATTAAATTCA 2280 

ACACTTTCGA TTATACGGCT CATATTAATA 234 0 

AAACTAAATG TGCCAGCTGT TTGATACTGG 24 00 

ATAC CAACTT CTTCTATTTC AAATAAAAAA 2460 

TCGTTCTTAG TAGTAGGTTT CGTGCCTTCA 2520 

CGACCTTCTC GTGTCGATAA ATCAAATTCA 2580 

TGATATGTCC AATATGGTTC GACTGTTAAA 2640 

CTTGCTAATT GTTTTAAAAA TGGACCTGTT 2700 

TTAAGTTCTT TAAAATCTGT AATAT CATTT 2760 

GCATCATTAC TGAACG GAAC TAAAGTTAAA 2820 

ACCGTTCGAA TTAGAGCGTG TGCTGTTGCT 2880 

TAAAATGAAA TAATCAATGA TGGATTTGTA 2940 

ATATGTTCAT AGGGTTCAAA TTCGACAGTT 3 000 

GTAATACCGA TAACTTTACA AGCTTCTTCT 3060 

TCGCGTGTTG CAAATGGGGG ATTACCTAAA 3X20 
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TAATTTGCTA 


ATGTGCCTGC 


AGATGAGAAG 


GTTTCATCAT 


CAGGATGTGG 


AAATATTACT 


3 240 




AATACATGTC 


TTTCGTCAGT 


CATGTTGATG 


CCTCCTCTAT 


AAATTAAATG 


GTCGCTCACT 


3300 


5 


AATTTGAAGT 


GCTGCAGCGA 


GTTGACCTTC 


GTAATTAAAA 


CCTGCAATTA 


AAAATTCATC 


3360 




ATG CTCATTG 


ACCTCAAAAT GCGTTAGACC 


TTGTACATAA 


ACCCAACCAC 


CATTTGATAG 


3420 


10 

• 




ATGCGATAAG 


GTTCTTTATT 


ACCACCTTTT AGTTGTGCAT 


GCGTATATGT 


3480 


X<Tll X X X AX VJ 


TTTCTTAAAA 


AAGTACCAGC 


ATTAAAAACA CGTTGATCGA 


AATGGTTCGC 


3540 






TTTGTCGTTT 


CAACATGCAG 


ATACACAGGT 


TTATGTTCAA 


AAGAAGCAAG 


3600 


15 




ACTTCTTGTT 


CTTTaATTGG 


TTCCAACACG 


TTCACTCCTT 


ACACTATCAA 


3660 






TTTCTATTTT 


ACTAAAAACT 


ATTCGATAAT 


TGTATACGAT 


TGCTCAATTA 


3720 




11 1 A x AAA X 1 


AATTTTCATG 


AAGGGTAATT 


ACTCAGGATT 


ACGTAATCAT 


ACAGCATTAG 


3780 


20 


rrriTTACTT 


TTAAAAATCA 


AAAATTTGTT 


GGAATTTGAA 


AAGTGTTAAA 


CATTAAAAAT 


3840 




GATGCTATAT 


TAATGGTGTA 


TGAATGAATT 


CATAAGTTTT 


TAAAATGTAT 


TAAATTTGTG 


3900 




GAGGCATGTA 


AACAATGAAA 


GTATTAAACT 


TAGGATCGAA 


AAAACAAGCA 


TCATTCTATG 


3960 


25 


TTGCATGTGA 


GTTAT ATAAA . GAGATGGCAT 


TTAATCAGCA 


CTGTAAACTA 


GGTTTAGCAA 


4020 




CTGGTGGTAC AATGACAGAT TTGTATGAAC AACTTGTTAA GTTGTTAAAT 


AAAAATCAGT 


4080 


30 


TAAACGTAGA 


CAATGTATCC 


ACGTTTAATT 


TAGACGAATA 


TGTAGGTTTA 


ACCGCATCAC 


4140 


ATCCGCAAAG 


TTATCACTAT 


TATATGGATG 


AGATGCTTTT 


CAAACAATAT 


CCTTATTTTA 


4200 




ATAGAAAGAA 


CATT CAT ATT 


CCAAATGGAG ATGCCGATGA TATGAATGCG GAAGCGTgCA 


4260 


35 


AAATATAATG 


ACGTTTTAGA 


ACAAGAAGGT 


CAACGTGATA 


TTCAAATTTT 


AGGTATTGGT 


4320 




GAAAATGGTC 


ATATTGGATT 


TAATGAACCT GGTACGCCGT 


TTGATAGCGT 


TACTCATATC 


4380 




GTTGATTTGA 


CTGAAaGTAC 


TATTAAGGCT 


AATAGTCGAT 


ATTTTAAAAA 


CGAaGATGAT 


4440 


40 


GTTCCAAAGC 


AAGCCATTTC 


GATGGG ACTT 


GCTAATATTC 


TTCAAGCCAA 


ACGTATCATT 


4 500 




TTACTCGCAT 


TTGGTGAAAA 


GAAACGTGCT 


GCTATTACAC 


ATTTATTAAA 


TCAGGAAATT 


4560 




TCTGTTGATG 


TTCCAGCCAC 


ATTACTTCAC 


AAACACCCGA ATGTTGAGAT ATATTTAGAC 


4620 


45 


GACGAAGCTT 


GCCCGAAAAA 


TGTTGCGAAA 


ATTCATGTCG 


ATGAAATGGA 


TTGATTGCAA' 


a can 

4DOU 




TGTTTAATTA 


AGAAATGCCT 


CGGGAAAGGT 


TCCAATAGAA 


AGATAAAAAG 


CATTGGAAGG 


4740 


SO 


ATGATTTTTA 


GTGGAATTAC 


AATTAGCAAT 


TGATTTATTA 


AACAAAGAAG 


ACGCGGCTGA 


'4800 


GTTAGCAAAT 


AAAGTAAAAG 


ATTATGTAGA 


TATCGTAGAA 


ATCGGTACGC 


CAATCATTTA 


4860 




CAACGaAGGT 


TTACCAGCAG 


TTAAACATAT 


GGCAGACAAC 


ATTAGTAATG 


TAAAAGTATT 


4920 



55 
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CGCGGATGTA ATTACAATAC TAGGTGTTGC 
AGAAGCTCAT AAAAATAATA AACAATTACT 
5 AAAACGTGCA AAAGAACTAG ATGAAATGGG 

TGATTTACAA GCAGAAGGGC AATCACCATT 
TAAAAATTCT AAAGTTGCAG TAGCAGGTGG 

10 

CGCTGAAAGT CCTGATCTTG TTATTGTTGG 
AGAAGCTGCG AAACAATGTC GCGCTGCZAAT 

1$ ACTATCAATT AATTCTAGAT GAATTAAAGA 

TTTCAACTTT TGCATCCAAA ATACTACATG 
GTTCAGGATT CGTGGCGAAT AGTTTTGCAA 

20 ATGTTGTTGG AGAATCAACG ACACCTG CGA 

CTGGTTCAGG TTCCACGGAA CATTTAAGAT 

CTGACATCGT ATTAATTACT ACAAATAAAG 

25 ' 

ACATCGTTTT GCCTGCAGGT ACAAAATATG 

GTTTGTTTGA ACAAGCATCT CAATTATTTT 

AAATGAATGT TACGGAACAA ACGATGCAAC 

30 

ATAGTCGATA ATATGATGCC TAGGGAGAAA 
AAATTATAGT ATAATATCAA TAATAAACGA 

3$ TATATTTTTG ATTTTGATGG TACGTTGGCA 

CAAAGTG CAT TTAAAGCATG TGGCTTAACG 
ATGGGAATAC CTATTGAAGA ATCATTTTTA 

40 GCATTAGCAA AGTTAATCGA TACATTTAGA 

ATTTATGAAT TTGCGGGTAT AACTGAAGCC 
CTTTTCGTGG TGTCTAGTAA GAAGAGTGAT 

45 

TTAAATCACT TGATTACCGA AGCTGTTGGA 
CCTGAAGGCA TACACACAAT TGTGCAACGC 
ATTGGTGATT CAACGTTTGA TGTTGAGATG 

SO 

GTCACTTGGG GTGCACATGA TGCAAGGTCA 
AATGATCCAT CAGAAATTAA TACCGTATTA 

55 



AGAAGATGCA TCAATTAAAG CAGCTATTGA 5040 

AGTTGATATG ATTGCTGTTC AAGATTTAGA 5100 

TGCTGATTAT ATTGCAGTAC ACACTGGTTA 5160 

AGAAAGTTTA AGAACCGTTA AATCTGTTAT 5220 

AATTAAACCA GATACAATTA AAGATATTGT 5280 

TGGCGGAATC GCAAATGCAG ATGATCCAGT 5340 

CGAAGGTAAG TAATATGGCT AAATTTAGTG 54 00 

TGACTTTGTC ACATGTTGAA GCGGATGAGT 5460 

CTGAACATAT ATTTGTAGCT GGCAAAGGAC 5520 

TGCGCTTAAA TCAGCTCGGC AAACAGGCAC 5580 

TTAAGTCGAA TGATGTATTT GTAATTATCT 5640 

TATTAGCAGA CAAAGCAAAA TCAGTAGGTG 5700 

ATTCTGCAAT AGGCAATCTA GCTGGGACGA 576t) 

ATGAACAAGG CTCGGCACAA CCATTAGGAA 582 0 

TAGATAGTGT TGTAATGGGA TTGATGACTG 5880 

AAAATCATGC TAATTTAGAA TAAAATAAAG 594 0 

TATTATCGAT TATTTTTTTA TTTAAATAAT 6 000 

ATAGGGGTGT TAATATTGAA GTTTGACAAT 6060 

GACACGAAAA AATGTGGTGA AGTAGCAACA 6120 

GAACCATCAT CTAAAGAAAT AACGCATTAT 6180 

AAATTAGCAG ACCGACCATT AGATGAAGCA 624 0 

CATACATATC AATCTATTGA AAAGGACTAT 63 00 

ATTACAAGTT TGTATAACCA AGGGAAAAAA 6360 

GTAtTAGAAA GAAATTTATC GGCTATTGGA 6420 

TCCGATCAAG TAAGTGCATA TAAACCAAAT 64 80 

TACAATTTAA ATAGCCAACA AACGGTGTAT 654 0, 

GCACAACGTG CTGGTATGCA ATCTGCAGCT 6600 

TTACTTCATT CAAATCCGGA TTTTATTATT 6660 

TAAAACTTGT TAAAACAGAG AATACCATGG 6720 
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ATTTAAAATA AATATTTATT AAACATTATG 
ATAATTTATT TTTGTAAAAA TAAATTAAAG 
5 ATAAACATTT AAATACGATG TCGAAAATGG 

GctATCGCTA TTTTTAGTTA TAATTCCAAA 
TATTGTTTAA TTCAAATGTA TGAGGGTATA 

TO 

ATTTTTGAAC AAACATACTT TTGTATTTAT 
AAACTAATTA ACTCCGTATA ATTATGAAAC 

15 TTTAATAAAG AGAATATTAA CATGGTGGAT 

ACCGGTATCG GTAATGCAAT GGAATGGTTC 
TACATTGGAG CGAACTTCTT CTCTCCAGTA 

20 TTCGCAGCAT TAGCCATTGC GTTTTTATTA 

ATTGGTGACA AATATGGACG TAAAGTTGTA 
TCAACATTAA CCATTGGATT ATTGCCAAGC 

25 CTATTATTGC TTGCAAGAGT ACTACAAGGG 

ATGACATATG TTGCCGAATC ATCTCCAGAT 
GAAATTGGGA CATTATCAGG TTACATAGCT 

.30 

TTTTTAACAG ATGAACAAAT GGCATCATTT 
TTCCTAGGAT TATTCGGCTT ATATTTACGT 

35 AATGATGTTG CAACACAACC AGAAAGAGAT 

TATTACAAAG ATATATTTGT ATGTTTTGTA 
ATGGTAACTG CATATTTACC AACCTATTTA 

40 ACAAGTGTAT TAATTACTTG TGT CATGGCA 

AAGTTAGCGG ATAAAATAGG TGAAAAGAAA 

TTATTCAGTA TCATCGCATT TATGTTATTA 

45 

GGTATATTTA TATTAGGATT TTTCTTATCA 

CCAACGATGT TTTACAGTCA TATAAGATAT 

GTTTCGATAT TTGGTGGTaC GaCGCCATTA 

SO 

GATCCATTAG CmCCTGCGTA TTATTTAACA 
ACATTCTTAC ATTTAAGTAC AGCAGGAAAA 

55 



AATTTTTAAA GAGTAATGTC TGACTCGTTG ' 6840 

TAATGACAAA GTTATTGAAG TAAATTGAGT 6900 

CGATAGCATA TCACTTACAT GAAGTTGTGT 6960 

AAGTTAATCG TTCGATGATT TAAGAATTAT 7020 

AAATCATTGA ATTTAATTCG ATAAAGCGAA 7080 

ATAAAAGTTT AAATTCTTAT AAATTTGACA .7140 

ATACAAGAGG GAGTGTATGA ATTCATGGAT 7200 

GCAAAGAAAG CTAAAAAAAC CGTTGTTGCA 7260 

GATTTTGGTG TCTATGCATA TAcAACTGCG 7320 

GAGAATGCAG ACATTCGACA AATGTTGACT 7380 

AGACCAATTG GTGGTGTCGT ATTTGGTATT 7440 

TTAACATCTA CAATTATTTT AATGGCATTT 7500 

TATGATCAAA TTGGACTTTG GG CACCAATA 7560 

TTTTCAACAG GTGGAGAGTA TGCGGGGGCA 7620 

AAGCGTCGTA ACTCATTAGG TAGTGGACTA 76 80 

GCTTCAATTA TGATTGCTGT ATTAACATTC 7740 

GGTTGGAGAA TCCCATTCTT ACTCGGTTTA 7800 

GGTAAGCTGG AAGAATCACC AGTTTTCGAA 7860 

AACATTAACT TTTTACAAAT CATCAGATTT 7920 

GCTGTTGTAT TCTTCaATGT TACAAACTAT 7980 

GAACAAGTTA TTAAATTAGA TGCAACGACA 8040 

ATAATGATTC CATTAGCATT AATGTTTGGT 8100 

GTATTTCTAA TTGGTACTGG TGGGCTAACA 8160 

CATTCACAAT CATTTGTTGT AATAGTAATG 8220 

ACTTACGAAG CGACAATGCC AGGGTCGTTA 8280 

CGAACTTTAT CAGTAACATT TAATATCTCT 8340 

GTkGCAmCaT GGTTaGTTAC GAAAACTGGA 84 00 

GCAATCAGTG TTATTGGCTT TTTAGTTATT 8460 

TCTCTAAAAG GTTCGTATCC AAATGTAGAT 8520 
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GAACGTAAGA 


> ATTAGAGATT 


' TTAATaAAAA GTATAAATCA 


ATCGTATATA AGCACTTTAA 


8640 




AGCTAGTAGG 


TTCTGCTAAC 


TTTAAAGTGC TTTTTAAATT 


GAGAACTGTA ATTAGCCGTA 


8700 


5 


ATAAAGTTTT TGTATATACA TAAACCCCCA CTGCAATG AT TATCGCAATG GGGGAAAGAG 


8760 




GGGACTTAAA 


GCATATGTTT 


AGCTTTGAAT ACTTAAAATT 


CTCTTGCTAT TGAAATGTTA 


8820 


10 


GGATGTAAAT 


ATGTCTTAGA 


GTATTTTGTC CAACGCAATT 


AATATTGAGA CTCTAACCTT 


8880 


CAATATTATT 


ATAGAGAACA 


CAAACTTAAA TAGATTGGGT 


GACTTATTTG TGTCAGTTAT 


8940 




TGCGATTGCG 


ATAACTTCTT 


TTCTCTATAT ACATATAGTA ACGTCTTATC TAATAAAAAA 


9000 


IK 


CATGGTACTA 


CAGTATCAAA 


TTTATCTAGG . GCTTAAGTTT 


GATTTTTATA ATAGGCAGGT 


9060 




TTACCTGATA 


AAAATACTTA 


TTCATTATAT AATGTTAACA 


ATATGTATTT TAAAGTTTAC 


9120 




ATTGAGTGAG 


GGATATTGAT 


GAACGTAATT TTAGAACAGT 


TGAAAACACA TACTCAAAAT . 


9180 


20 


AAACCTAATG 


ACATAGCATT 


ACATATCGAT GATGAAACAA 


TTACATATAG TCAACTAAAT 


9240 




GCCCGCATCA 


CTAGCGCAgT TGAATCTTTG CAGAAATATT CACTTAACGC TGTCGTTGCT 


9300 




ATTAATATGA 


AATCACCGGT 


GCAAAGTATT ATTTGTTATT 


TAGCTTTGCA TCGTTTACAT 


9360 


25 


AAAGTGCCTA 


TGATGATGGA 


AGGTAAATGG CAAAGTACTA 


TACATCGTCA ATTGATTGAA 


9420 




AAATATGGTA 


TTAAAGATGT 


AATTGGAGAT ACAGGTCTCA 


TGCAGAATAT AGACTCACCG 


9480 




ATGTTTATTG 


ATTCAACGCA 


ATTACAGCAC TACCCCAATT 


TATTACATAT TGGTTTTACT 


9540 


30 


TCAGGGACAA 


CTGGACTGCC 


AAAAGCATAT TATCGTGATG 


AAGATTCATG GTTGGCTTCT 


9600 




TTTGAAGTTA 


ATGAAATGTT 


GATGTTAAAA AATGAAAATG 


CAATAGCAGC CCCTGGACCA 


9660 


35 


CTATCGCACT 


CGTTAACATT 


ATATGCGTTA TTGTTTGCTT 


TAAGTTCCGG TCGTACTTTT 


9720 


ATAGGACAGA 


CCACTTTTCA 


TCCTGAAAAG TTACTTAATC 


AATGTCATAA AATATCATCA 


9780 




TACAAAGTTG 


CTATGTTTCT 


TGTTCCAACG ATGATTAAAT 


CATTATTGTT AGTTTACAAC 


9840 


40 


AATGAACATA 


CAATCCAATC 


ATTTTTTAGC AGTGGAGATA 


AGCTGCATTC TTCTATTTTT 


9900 




AAAAAGATAA 


AAAATCAAGC 


AAATGACATA AATTTGATTG 


AATTTTTTGG TACATCGGAA 


9960 




ACCAGTTTTA 


TCAGCTATAA 


CTTGAATCAG CAAGCACCAG 


TTGAATCAGT AGGTGTGCTA 


10020 


45 


TTTCCAAATG 


TGGAATTGAA 


AACAACGAAT CACGATCACA 


ATGGTATAGG AACTATTTGT 


10080 




ATAAAAAGTA 


ATATGATGTT 


TAGTGGCTAT GTAAGTGAAC 


AATGTATAAA TAATGATGAA 


10140 




TGGTTTGTTA 


CTAATGATAA 


TGGCTATGTA AAAGAGCAGT 


ATTTATATTT AACGGGACGT 


10200 


SO 


CAACAGGATA 


TGTTAATTAT 


TGGTGGTCAA AATATATATC 


CAGCACATGT TGAACGCCTT 


10260 




TTAACGCAAT 


CTTCGAGCAT 


TGATGAAGCA ATTATCATCG 


GTATTCCAAA TGAGCGTTTT 


10320 
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CAATTTTTAA AAAAGAAAGT GAAaCgnTaT 


GAAATT CCAT • 


CGATGATTCA 


TCATGTAGAA 


10440 




AAGATGTATT 


ACACTGCAAG 


tGGTaAAATT 


GCTAGAGAAA 


AAATGATGTC 


GATGTATTTG 


10500 


s 


AGAGGTGAAT TATAATATGA ATCAAGCAGT 


CATAGTTGCA GCTAAACGAA 


CTGCATTTGG 


10560 




GAAATATGGT 


GGCACTTTAA 


AACATTTAGA 


GCCaGAACAA 


TTGCTTAAAC 


CTTTATTCCA 


10620 




ACATTTTAAA GAGAAGTATC 


CAGAGGTAAT 


ATCTAAAATA 


GATGATGTAG 


TTTTAGGTAA 


106BO 


10 


TGTTGTTGGG 


AATGGTGGCA ATATTGCAAG 


AAAAGCATTG 


CTTGAAGCGG 


GGCTTAAAGA 


10740 




TTCAATACCT 


GGCGTCACAA 


TCGATCGGCA 


ATGTGGGTCT 


GGACTTGAAA 


GTGTTCAATA 


10800 


15 


TGCATGTCGC ATGATCCAAG CCGGAGCTGG 


CAAGGTATAT 


ATTGCAGGTG 


GTGTTGAAAG 


10860 


TACAAGTCGA GCACCTTGGA AAATCAAACG ACCGCATTCT 


GTGTACGAAA 


CAGCATTACC 


10920 




TY3 21 CZ.' I " I I ™ I ' & T* 
IVinul x x ini 


GAGCGTGCAT 


CATTTGCACC 


TGAAATGAGC GACCCATCAA TGATTCAAGG 


10980 


20 


TTJPTGAAAAT 


GTGGCCAAGA 


TGTATGATGT 


TTCAAGAGAA 


TTACAAGATG 


AATTTGCTTA 


11040 




X Uunnvj X ^— a 


CAATTGACAG 


CGGAAAATGT 


AAAGAATGGA 


AATATTTCTC 


AGGAAATATT 


11100 




ACCTATAACC 


GTTAAAGGAG 


AAATATTCAA 


CACTGATGAA 


AGTCTAAAAT 


CACATATTCC 


11160 


25 


GAAAGATAAC 


TTTGGCCGAT 


TTAAGCCCGT 


GATCAAAGGT 


GGGACCGTTA 


CCGCTGCGAA 


11220 




TAGTTGTATG 


AAAAATGATG 


GTGCAGTTTT ATTGCTTATT ATGGAAAAAG 


ATATGGCATA 


; 11280 




CGAATTAGGT 


TTCGAGCATG 


GTTT ATT ATT 


TAAAGATGGT 


GTTACGGTAG 


GTGTTGATTC 


11340 


30 


TAATTTTCCT 


GGCATTGGTC 


CAGTACCAGC 


CATTTCCAAC . 


TTACTAAAAA 


GAAATCAATT 


11400 




AACGATAGAA 


AATATTGAAG 


TCATTGAAAT 


TAACGAAGCG 


TTCAGTGCAC AGGTAGTTGC 


.11460 


35 


CTGCCAACAA 


GCTTTAAATA 


TTTCAAATAC GCAATTAAAT 


ATATGGGGTG 


GTGCATTAGC 


11520 


ATCAGGTCAT 


CCATACGGTG 


CAAGCGGTGC 


CCAATTAGTG 


ACTCGATTAT 


TTTATATGTT 


11580 




TGACAAAGAG 


ACTATGATTG 


CATCTATGGG 


GATAGGGGGA 


GGTCTAGGAA 


ATGCAGCATT 


11640 


40 


ATTTACTCGA 


TTCTAACCAG 


CGATTAAATG 


TGTCATTTTC 


TAAGGATAGT 


GTGGCTGCAT 


11700 




ATTATCAGTG 


TTTTAACCAA 


CCTTATAGAA AAGAAGTACC 


ACCATTAATG 


TGTGCGTCAT 


11760 




TATGGCCAAA 


ATTTGATTTA 


TTTAAAAAAT 


ATGCAAATAG 


CGAACTGATT 


TTAACAAAAT 


11820 


45 


CAGCAATTAA 


TCAAACTCAA AAGATAGAAG 


TAGACACAAT 


ATATGTAGGG 


CATTTAGAAG 


XXQ BU 




ATATTGAATG 


CCGACAGACT 


CGCAATATCA 


CACGTTATAC 


AATGGCTTTA 


ACATTAAGTA 


11940 




AAAATGATCA 


ACATGTCATA 


ACGGTtACAC 


AAACTTTTAT 


TAAGGCGATG 


AAGTAGAGAT 


12000 


50 


GGAGTTTAAT 


GAGATATOGA 


TAAATGAATA 


TTTGGCGCTC 


GTAAATGATG 


ATAAT CCAAT 


12060 




ACATAATGAG 


ATTGTGCCAG 


GACAATTAGT 


GAGTCAAATG 


ATGCTGATGG 


CTATGTCATT 


12120 
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ATTCATTGAA CAACACGAAC ACGAAATTAT 
AAAAATTTCT TTGAGCACAA AAAAATAACC 
5 GGAGATGAAA GGACAGCTAA TATCAGTTAT 

AATATAGGTT ACGTTTCTTT CTTTGCAOGG 
CTATATCAAT GTTTAATAAA TTCTGGATTA 

10 

CATATGATCT ATATCGTCTT GTAATAAAGA 
TGAATCGTCA CATTTAATTG AAACATGCTG 

15 TGCGCCTTCA TGGTGATACT GTCGATAAAT 

TCTATGGTTA TATTATAAAT AACATTTTTA 
TTATCAGACA TAGAACGTAT GATTTACTAA 

20 TATATATTTA TAGAGTCGCC TGGCAGTCAT 

GCATCTATCG CAAAAGAATG ATAATGATAG 
CATCTTGAAA ATAAAGGGTT ATTTAGTCAT 

25 

TATTGTTCGA TATGTATGAA ATTTTCAATA 
* AATTTAAATT ATATACAGAG CATGATGATT 
GTTCATACCC AATTTAAGTG GTGTGGCTAA 

30 

CGTTAAACCT CTGTTACTTC AACATCGATA 
ACAGGACCAA CAAAATCATT CATTTTCCAA 
TTCGCGCTAA TCACAGCTTC TTTCGGTGAC 

35 

GCAGCAAATG TACAACCAGC ACCATGGTTA 
TGATAAAATG TTTGACCATC ATAGTATAAG 

40 CCACCTTTAA TGATGACATG CTGTGCGCCT 

ATATCTTCAA TTGAATTTAA TTTACCTAAT 
GGTGTCACTA CCGTTGCTTT AGGTAGTAAA 

45 TTAAGCACTT CATCTTCGCC TTTACAAACC 

TTAGATGGGT CATATACTTC TCCAGCACGT 
GTTTTAATAG CATCAGGTCC GATTGATAAA 

SO 

ATTGGTAATG GTGTAACATC GTGTGACCAT 
AAAGCGACCA TGCCATACGT ATCTAATTCT 

55 



AGCAATTAAT GACGATGGAG AGATTAAAAT 12240 

GATATTAGCT GCATGAACGC ATATTAATTA 12300 

GTATTGTTAT TATTATTGGG AACAOAGATG 123 60 

GGATGCATTA ATCTAAAATA ATAATAACAA 12420 

TTGGAACGAT TAGTCAATTT AACTAACTTT 124 BO 

GAGCAATTTG AATATTTCAG TATCACTAAA 12540 

AAACGTTTTG GTTATAATTT CATAAACTGG 12600 

AATCATAACC TATATTACCT CCTTTGCTAC 12660 

TGTGTGACAT CAACCTTAAG TATCAACTTT 12720 

GACTATTTAT GTATAAAAGT TCTAAATAAA 12780 

TTGGGaAATA TAACATATAT GATTAGAGAG 12840 

AGGTATTGAG CATATAGATG AG TTT AAGTT 12900 

AGATGTAGAT GTATAGGAAA TATTTGTATG 12960 

AAAGCTAATA ACGCTTATAT GTAACTTTCA 13020 

ATAAAAAAAT AACCACATCA CATAAATTGA 13080 

TAATGTTGAT TTATAGATGA ACCGCCTAAT 13140 

TGTTCAATAC GGTTGTATGC ACCGTGATCC 13200 

CCGTTTTTAA TAGCAGAAGC GACGAAAGCT 13260 

TTACCGTTAG CTAAATATGC AGTTGTTGCC 13320 

TAACTTTGTT GGAACATGTC TGTTGTTAGT 13 380 

TCATACGATT TATCTTGATC TAAAGCTTTG 13440 

TTATCAAAGA TAATTGTTGC AGCCTTTTTC 13500 

CCTGATAATT GACCCGCTTC AAATAAGTTT 13560 

TATTTAATCA TCGCCTCAGT ATTTCCAGGA 13620 

ATGACAGGAT CTACfACAAA ATATTGTGCA 13 680 

TTGATTATCT CCTCAGTACC TAACATACCT 13740 

GCCGTTTCAA GTTGTTTTTC AAATACATCC 13800 

GTATCTTTAT CCATAGTAAC GATGGCAGTT 13 860 

TGGAACGTTT TCAAATCTGC TTGCATACcT 13 920 



634 



EP 0 786 519 A2 



10 



15 



20 



25 



35 



40 



45 



CACTCCTACA TAATAATATT GTATTCATCA TATCATTTTT AACCTAATTG AAAAATATTA 
AGCATTCAAT ATTTGATGAT TGTTGAAATG AATCATTCAT ACTATTGTAA CTTTTGAAAA , 
TGTCATTCAC TTTAGATAAG TGTGATATGT TAAAATATGT CCTGAGGTGA GATTGAATGG 
AATCGTOGCA AATTTTTCAT GACATAACAA CGAAACATGA CTTTAAAGCT ATGCATGATT 
TTTTAGAAAA AGAATATTCG ACTGCAATCG TATACCCTGA TAGGGAAAAT ATATATCAAG 
CGTTTGATTT AACACCGTTT GAAAATATCA AAGTTGTTAT ATTAGGACAA GACCCGTATC 
ATGGTCCAAA CCAAGCACAT GGATTAGCAT TTTCAGTGCA ACCTAACGCA AAATTCCCTC" 
CATCTTTACG TAATATGTAT AAAGAATTAG CAGATGATAT TGGATGCGTT AGACAAACAC 
CGCATTTACA AGATTGGGCA AGAGAAGGCG TCTTGTTATT GAATACAGTT TTAACCGTAA 
GACAGGGTGA AGCAAATTCT CATCGTGATA TTGGTTGGGA AACATTTACT GATGAAATTA 
TTAAAGCAGT GTCTGATTAT AAAGAACATG TTGTCTTTAT TTTGTGGGGG AAACCTGCAC 
AGCAAAAAAT AAAGCTTATC GATACATCTA AACATTGTAT TATAAAATCA GTGCATCCTA 
GTCCACTGTC TGCATATAGA GGATTCTTTG GATCAAAACC GTATTCCAAA GCGAATGCCT 
ATTTAGAGTC AGTAGGAAAA TCACCAATTA ATTGGTGTGA AAGTGAGGCG TAGATGTTGA 
ATAGAGAAAC TTTAATAGCA CGAATTGAGC AAGAATTAGT ACAAGCAGAG CAGGCACAGC 
ATGACCATGA CTTTGAAAAA CATATGTATG CCATACATAT ATTAACATCT TTATATGCTT 
CAACATCAAA TACACCACAT ATTGGTGAAC AACAAATGAA TCGTCGTATT GCTAACCATA 
ATCAAATGCC ACAATCACAA ATAACGCAGC CAACTCATCA AGTGACAGTT GCTGAAATTG 
AAGCGATGGG TCGTAAAGTA AATACGCATT CAGCACATCA TCATAATAAG TCATATTCAC 
AACCTTCAAA CCAACAACAA AGATTAGCGA CAGATGATGA CATTGGCAAT GGTGAATCCA 
TATttGATTT TTAAAAAGCA ACAATGAAAC ATAATTACTT AATAGCTTGT TAAGTATGTA 
GGTTAATAAT CAAGACGCAT ATACTTTTAT TCGAGTGTTC GGATTTAAAC ATTTATTAAT 
ACTGAATTAT ATAAGGAGAG GTAGCAATGA AATTATTTAT TATTTTAGGT GCATTAAACG 
CGATGATGGC TGTCGGTACA GGTGCATTTG GTGCGCATGG TTTACAAGGA AAAATAAGTG 
ATCACTATTT ATCAGTATGG GAAAAAGCAA CGACGTATCA AATGTACCAT GGCTTAGCAT 
TATTAATTAT AGGTGTAATT AGTGGTACAA CTTCAATCAA TGTTAACTGG GCTGGCTGGT 
TAATATTTGC TGGTATTATT TTCTTTAGTG GATCATTATA TATTTTAGTA TTAACTCAAA 
TTAAAGTTTT AGGTGCGATT ACGCCAATTG GTGGCGTATT GTTCATCATT GGATGGATAA 
TGTTAAT CAT TGCGACATTC AAATTTGCTG GTTAAATTTT AAAACTTTAG ATT AC CTATG 



1404 0 

14100 

14160 

14220 

14280 

14340 

14400 

14460 

14520 

14580 

14640 

14700 

14760 

14820 

14880 

14 940 

15000 

15060 

15120 

15180 

15240 

15300 

15360 

15420 

15480 

15540 

15600 

15660 

15720 
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TGGGTATAGA ATACCTTCGA GGTGAGTTTT 
ATAGAGGCGA TTTAAAACAA AACCTATCTG 
5 CATGTATCGG ATGGGGCGCA TTCATCTTAC 

TTGCAGCATC AATTGGTATA GTTATTGGTG 
ATGGCGCATT AGTAGAGAGA TTTCCAGTAT 

10 

GTTTCGGCAG ATATGTGAGT TTCTTCTCAT 
TCGTTGCTTT AAAtGCGACC GCATTCAGTT 

r5 TAAATAATGG GAAACTATAC ACCATTGCGG 

TTGCGACCGT ATTACTACTT GTATTCATGC 
GATCATTACA ATATTATTTC TGTGTGGCGA 

20 GTTCATTCTT TGGTAATAAT TTTGCACTTG 

AAGGATGGTT AGTGTCTATT GTGGTTATTG 
TTGATAATAT TCCACAAACA GCAGAAGAGT 

25 TTATCGTGTA CAGTTTATTA GCAGCATCAT 

GTTGGTTATC AACAAGTCAT CAAAGTTTAA 

CACAAACAGC ATTTGGTTAT ATTGGATTAG 

30 * 

TATTTACTGG TTTAAATGGA TTCTTGATGA 

GTTCAGGTAT TATGCCAACA ATGTTTAGTA 

TCGCAATCAT ATTCCTAGTA GGAGTGTCGT 

35 

TGACTTGGAT TGTAGATATG TCATCTACTG 
TGTCTGCAGC GAAATTATTC AGTTATAACA 

40 AAACGTTTGC TATTATCGGC TCATTTGTAT 

CAGGTTCTCC TGCAGCACTG ACTGCACCGT 
TCGGTTTAAT ATTCTTTGTG AtTCGATATC 

45 TAAGTCGCTT GATTTTAAAT AGAAGTGAAA 

AAAAAGAAAA AACTAAATAA TAAAAGAATC 
ATCGTGCGAT TTTTTGTATT ATAAATTGAC 

SO 

TAATTGCTAA GAGTTAGGGG TGAGCCATTT 
TTCACGAACC CAGAAACAAT TAATTTGGAA 

55 



TATTTATGGA AAAAAAGAAT AAGCAAATAG 15840 

AAAAGTTTGT ATGGGCGATT GCATATGOTT 15900 

CAGGAGACTG GATTAAGCAG TCAGGTCCGA 15960 

CATTATTAAT GATATTAATT GCGGTTAGTT 16020 

CAGGGGGCGC GTTTGCCTTT AGTTTCTTAA 16080 

CATGGTTTTT AACTTTTGGT TATGTCTGTG 16140 

TACTAGTTAA ATTCTTATTG CCAGATGTCT 16200 

GCTGGGACGT TTATATTACG GAAATCATTA 16260 

TAGTAACGAT TCGTGGCGCA AGTGTATCTG 16320 

TGGTAATCGT CGTATTATTG ATGTTGTTTG 16380 

AAAATTTACA ACCGTTAGCT GAACCTAGCA 1644 0 

TATCCGTGGC ACCATGGGCA TATGTTGGAT 16500 

TTAACTTTGC ACCAAACAAG ACATTTAAGC 16560 

TAACTTATGT TGTCATGATT TTATACACTG 16620 

ATGGGCAGTT GTGGTTAACA GGTGCTG t TA 16680 

GTGTATTAGC AATTGCAATT ATGATGGGTA 16740 

GTTCAAGTCG CTTGTTATTT TCTATGGGAC 16800 

AATTACATAG TAAATACAAA ACACCATATG 16860 

TAATTGCACC TTGGCTAGGA AGAACTGCAT 16 920 

GTGTATCCAT TGCCTACTTT ATTACATGTT 16980 

AACAAAGTAA TACGTATGGA CCGGTTTACA 17040 

CATTCATTTT CTTAGCGTTG TTATTAGTGC 17100 

CTTATATTGC ATTACTTGGA TGGTTAATCA 17160 

CTAAATTGAA AAATATGGAT AATGATGAAT 17220 

ATGAAGTTGA TGATATGATT GAAGAACCTG 17280 

GCACAATAAA CGTTCTTCAT TCGGAGGCGT 17340 

ATTTAAGACG AGGCAGCTGA ACCTTATATA 17400 

CTAACAAATA TTTATAATCG TTTAAAAGAT 17460 

ATTTGGTCGG CGAATAATAA ACCTAATGCG 17520 
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10 



15 



AAGACTAAAT TTTTTGTAGC ATCGTATGCT AAGCCACCAG GTACTAATGG AATGATACCC 
GTTACCATAA AAATGATGGC AGGTTCTTTT TGTTTACGAG CCATATAATG ACTTAACAAG 
CCTAATGCTA AACTACCAAA GAAACTAGAG TATATAGTGT GCACATTAAA GCCGTTGAAG 
AATAAGGTGT AAACGATCCA TCCACACGTA CCAACGAAAC CACATGATAG ATATAATTTT 
CTAGGTGCAT CAAAAATGAC GCAGAA 
(2) INFORMATION FOR SEQ ID NO: 110: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5544 base pairs 

(B) TYPE: nucleic acid . 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



17640 
17700 
17760 
17820 
17846 



20 



30 



35 



40 



45 



SO 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 110: 
ATTGACACTT GGTGAAAGTA ATATCGCCGC GCTATTTTGG CAAAATGGAC 
TGAGTTACAA GATGAACAGC CAATTAATAT ATTAGGATCT GkTCAAATCA 
TGGTAATCAA TCACCGCAAA TAATTATTCA AGATATTGCG ATGAATGAAC 
AGATTATAGA AGTAAGCGAA AAAGTTTACC TTTTACAGAA AATGATGAAA 
GCTTATTCAT CCTAAAAGTG ATAAAGTAAA TGCG AATGAA TATTATTATG 
TAAACAACAA ACTGATAAAG TAGTATTAAG AGATTTACCA ACGTCAATGG 
TAATTCCTTG CAACAACTGC AATTTTCTCA ACTTTATATA GTTTTGCAAC 
GATTTACTTC GATGGTATAC CTAATATGGA TATTTTTAAA AAGTGTTATA , 
AACTAAACAA GAAACAAATA TCCAGAAAGA GGGTATGTTA TTGTGTCAAC 
GAAACCAGAT ACACTTAAAT TCATGTTGAA AGTTTTCTTA GACTTAAAAT 
AGAAGATGGT TTAATTCGAA TCAATCAACA ACCTGATAAA AGATCGATTG 
AGTATATCAA TTAAGACAAC AACGTATGGA TGTTGAAAAG CAATTATTAT 
TTCAGAAATA AAAAATTGGA TAAAGTCACA ATTGTCGTGA GCAATTTAGG 
AATGGATTTA AAGCAATACG TATCAGAAGT TCAAGATTGG CCGAAACCAG 
CAAGGATATT ACTACAATTA TGGATAATGG TGAAGCATAT GGCTATGCAA 
TGTAGAATAC GCAAAAGACA GAGATGTTGA TATCGTTGTA GGACCTGAAG 
TATCATTGGC TGTCCTGTAG CTTATTCAAT GGGGATTGGC TTTGCACCTG 
AGGGAAATTA CCTCGTGmAG TCATTCGTTA TGAGTATGAC CTAGAATATG 



ACTTAGAACC 
ACGAATGGAA 
AGCAAATATT 
ATATTGTCGT 
GTGAAGAAAT 
AAGACTTGTC 
ATAATCATTC 
AAGCATTAAT 
ATTTAAGTGT 
TTGTAACACA 
ATTCCAGCAA 
ATCAAGATTT 
AGGAAATATT 
GTGTTAGTTT 
CAGATAAAAT 
CGCGTGGCTT 
TTAGAAAAGA 
GTACAAATGT 



_ 60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
. 840 
900 
960 
1020 
1080 
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ATTAGCTACT GGTGGTACGA TTGAAGCAGC 
GGTAGTAGGT ATTGCATTTA TAATTGAATT 
5 AGATTACGAT GTTATGAGTT TAATCTCATA 

AATGAAATCC TTCATCAAAT GTATAAGAAC 
TTTCTTAACA TGAGATGTTA GGATTTTTTA 

10 

ATACCTTAAT AACATCGTTT ATTTATTTGA 
AAAAATGAAA CAGTAGATTT AGGTCGAATT 

1S TACAAATTAA ACTCGCTCAA GTAAAATTAA 

TTATCGTCGA CGGACGTATG ATTGGTGTGG 
TCATTGTTTA AGGCGAAGTA ATAAATATGA 

20 ATCCATATAG TGCAGACGAA tTCTTCACAA 

TGAGTATGTT TTAAAAAGCT ATCATATTGC 
AAACGGATTA CCATACATTA TGCATCCTAT 

25 ATTAGACGGA CCGACGATTG TCGCAGGTTT 

TACATTTGAA GATGTAAAAG AAATGTTCAA 

GACGAAGCTT AAAAAAGTAA AATACCGCTC 

30 , . ■ ■ 

CAAGTTATTT ATTGCGATTG CCAAAGATGT 

ATTACATAAT ATGOGTACCT TGAAAGCCAT 

AGAAACATTA GAAATTTATG CACCATTAGC 

35 

GGAACTAGAA GATACGGCTC TTCGTTATAT 
TTTAATGAAG AAGAAACGTA GTGaACGTGA 

40 ACGTACTGAA ATGGACCGAA TGAATATCGA 

TTACAGTATT TATCGGAAAA TGATGAAGCA 
GTTGGCGATA CGTGTTATTG TCAATTCTAT 

45 GCATACGTTA TGGAAACCGA TGCCAGGACG 

AAATTTGTAT CAGTCATTGC ATACTACAGT 
CCAAATACGA ACGTTTGATA TGCACGAAAT 

SO 

TTACAAAGAA GGTAAAAAAG TAAGTGAAAA 
GTTAAAAGAA TTAGCTGAAG CGGATCATAC 

55 



AATAAAATTA GTTGAAAAAT TAGGCGGTAT 1200 

GAAATATTTA AATGGTATTG AAAAAATTAA 1260 

CGACGAATAA TAAATAATAT AATTTTATCA 1320 

CAATGACTTA ATTAAAAAAG TTGTTTAAGT 1380 

TTTACTGAAA ATGTTAGATG ATTGAGCATT 1440 

TAAATTGTAG TATCATAGAA CTAATATTTA 1500 

TTTGTAAAAG TTTTAAAAGT AGGAATAGTA 1560 

TATTACGATT AATGACGACA GGATAAATAT 1620 

GACAAATACT ATTCAACAAG AGTACCTAAA 1680 

ATGGGGTGTA TCATATAATG AACAACGAAT 1740 

AGCAAAATCA TATTTGTCAG CAGATGAATA 1800 

TTATGAAGCA CATAAAGGTC AGTTCCGAAA 1860 

ACAAGTTGCA GGTATTTTAA CAGAAATGCG 1920 

TTTGCATGAT GTAATTGAAG ATACACCGTA 1980 

TGAAGAAGTT GCTCGAATTG TTGATGGTGT 2040 

AAAAGAAGAA CAACAAGCTG AAAATCATCG 2100 

ACGCGTAATT TTGGTGAAAT TAGCAGACAG 2160 

GCCGCGCGAA AAACAAATTA GAATTTCTCG 2220 

ACATCGTCTT GGTATTAATA CAATCAAATG 22 80 

TGATAATGTG CAATATTTTA GAATAGTCAA 2340 

AGCGTATATC GAAACGGCTA TTGATAGAAT 2400 

AGGCGATATA AATGGTAGAC CTAAACATAT 2460 

GAAAAAACAA TTTGATCAAA TTTTTGATTT 2520 

TAATGATTGT TATGCGATAC TTGGGTTGGT 2560 

TTTTAAAGAT TATATTGCAA TGCCTAAACA 2640 

AGTAGGCCCA AATGGAGACC CGCTCGAAAT 2700 

TGCTGAGCAT GGTGTTGCAG CACACTGGGC 2760 

AGATCAAACT TATCAAAATA AGTTAAATTG 2B20 

ATCGTCTGAC GCTCAAGAAT TTATGGAAAC 2880 
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TGAGTTGCCA TATGGTGCTG TGCCGATTGA TTTTGCTTAT GCGATTCACA GTGAAGTAGG 
TAATAAGATG ATTGGTGCCA AGGTGAATGG CAAAATTGTA CCAATTGACT ATATTTTACA 
AACAGGCGAT ATTGTTGAAA TACGTACTAG TAAACATTCA TATGGACCAA GTCGTGATTG 
GTTGAAAATT GTTAAATCGT CTAGTGCCAA AGGTAAAATT AAAAGTTTCT TCAAAAAACA 
AGATCGTTCA TCTAATATTG AAAAAGGCCG AATGATGGTT GAAGCTGAAA TAAAAGAGCA 
AGGATTTAGA GTCGAAGATA TTTTGACAGA GAAAAATATT CAGGTTGTTA ATGAAAAATA 
TAACTTTGCA AATGAAGATG ATTTATTCGC AGCTGTAGGA TTTGGCGGCG TGACATCCTT 
ACAGATTGTT AATAAATTAA CTGAAAGACA ACGTATTTTA GATAAACAAC GTGCTTTAAA 
TGAAGCACAA GAAGTTACGA AATCATTGCC TATTAAAGAC AACATCATTA CTGATAGTGG 
TGTCTATGTA GAAGGTTTAG AAAATGTACT TATCAAGTTG TCAAAATGTT GTAATCCTAT 
ACCaGGTGAT GATATTGTAG GTTATATCAC CAAAGGTCAC GGTATTAAAG TACATCGCAC 
TGATTGCCCA AATATTAAGA ACGAAACTGA ACGACTAATT AATGTTGAAT GGGTAAAATC 
AAAAGACGCA ACTCAAAAAT ATCAGGTTGA TTTAGAGGTA At G CGTATGA CCGAAATGGC 
TTGTTGAATG AAGTACTACA AGCTGTTAGC TCGACAGCCG GCAATTTAAT TAAAGTTTCA 
GGACGTTCAG ATATTGATAA AAATGCAATA ATAAATATTA GTGTCATGGT GAAAAACGTG 
AATGATGTTT ATCGTGTGGT AGAAAAGATC AAACAACTTG GTGATGTTTA TACAGTAACA 
AGAGTTTGGA ACTAGAGGTG CAAAATATGA AAGTAGTTGT ACAAAGAGTT AAAG AAG CAT 
CGGTGACGAA TGATACATTA AATAATCAAA TCAAAAAAGG ATATTGTTTA TTAGTCGGTA 
TCGGTCAGAA CTCTACAGAG CAAGATGCAG ATGTAATTGC AAAGAAAATT GCTAATG CAA 
GATTATTTGA AGATGACAAT AATAAATTAA ACTTTAATAT CCAACAAATG AATGGTGAAA 
TACEATCAGT TTCACAATTT ACTCTCTATG CAGATGTAAA AAAAGGTAAC CGTCCAGGTT 
TCTCAAATTC TAAAAATCCT GATCaAGCGG TAAAAATTTA TGAGTATTTT AATGcaTGCG 
CTACGAGCGT ATGGT CTT AC TGTGAAAACA GGTGAATTTG GAACACACAT GAATGTTAGC 
ATAAATAATG ATGGT CCAGT CACTATTATT TATGAAAGTC AGGACGGCAA AATTCAATGA 
AAAAAATAGA GGCATGGTTA TCTAAAAAGG GTCTTAAAAA TAAACGTACT CTAATAGTAG 
TGATTGCCTT TGTCTTATTT ATCATCTTTT TATTTTTATT GCTGAATAGC AATAGTGAAG 
ATAGTGGGAA CATCACGATA ACTGAAAATG CTGAATTACG TACAGGTCCA AACGCTGCGT 
ATCCAGTCAT ATATAAAGTT GAAAAAGGTG ACCATTTTAA AAAGATTGGT AAAGTAGGTA 
AATGGATTGA AGTTGAAGAT ACATCCAGTA ATGAAAAAGG TTGGATAGCT GGATGGCACA 
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10 



16 



TAGTGCTTGA TCCTGGTCAT GGAGGTAGTG ACCAGGGTGC TTCAAGCAAT ACTAAATATA 4800 

AAAGTTTAGA AAAAGATTAT ACGTTGAAAA CAGCAAAAGA ATTGCAGCGT ACTTTAGAAA 4 860 

AAGAAGGCGC AACTGTTAAG ATGACAAGAA CAGACGATAC ATATGTTTCA CTAGAAAATC 4920 

GTGATATCAA AGGCGATGCC TATTTGAGTA TACATAATGA TGCGTTAGAA TCATCTAATG 4 980 

CAAATGGAAT GACaGTTTAT TGGTATCATG ATAATCAAAG AGCTTTAGCA GATACGTTAG 504 0 

ACGCTACGAT TCAGAAGAAA GGTCTACTTT CTAATCGCGG TTCAAGACAA GAAAATTATC 5100 

AAGTGTTAAG ACAAACAAAA GTTCCTGCTG TTTTATTAGA ATTAGGTTAT ATTAGTAACC 5160 

CAACTGATGA AACGATGATT AAAGATCAAT TACATAGACA AATTTTAGAA CAAGCAATTG 5220 

TTGATGGCCT TAAAATTTAT TTTTCTGCGT AGGGCTTGCA AAAATATGTG AAAGTAGTTA 5280 

TCATTGATAT TGAATTTTAT AACTAAAAGC GTTAGTATTC TTGAAATGGT AAATGAAATA 5340 

20 GGTAGCAATC TAACTAAGAT TGTGTAGGAA TATAATCCAT AGACTGAAAG ATTATGCTGA 5400 

GTAGTTTATA TACATTGAAC ACAAGAAGAG GTGCTTTATG AAAAGTAAAG CCGTTAAACG 5460 

TACGTTaAAC GTTTTGAGTG GGTTTATTAA ATGCACGCTT ATAAAAAGTA ATGATGATTA 5520 

25 CAATTAGGCA TGTTTTTTAA ACCA 5544 

(2) INFORMATION FOR SEQ ID NO: Ills 

r - " SEQUENCE CHARACTERISTICS: 

30 ^ (A) LENGTH: 1067 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

35 

:r '' ; (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 111: 

AAAftGATTGC AAATATAAAT GGCATGTTTA ATATGTTAGA ACAACAAATC ATTCATAGCC 60 

40 AAGATATGGC TCATTTTAGA AGTGAATTTT TTTACGTCAA TCATGaGCAT CGAGAAAACT 120 

ATGAAgCACT CCTAATTTAT TACAAAAATA GTATCGACAA TCCTATTGTA GATGGTGCAT 180 

GTTATATTTT AGCCCTACCT GAAATTTTCA ATAGTGTTGA TGTTTTCGAA TCAGAGTTAC 24 0 

45 CATTTTCATG GGTATATGAT GAAAATGGCA TTACCGAAAC AATGAAATCA CTTAGCATTC 300 

CATTACAATA TTTAGTTGCA GCAGCTTTAG AAGTAACTGA TGTGAATATA TTTAAGCCTT 360 

CAGGATTTAC AATGGGAATG AATAATTGGA ATATTGCTCA AATGCGAATC TTTTGGCAAT 42 0 

50 

ATACAGCAAT TATTAGAAAA GAAGCACTAT AACATTAATA ATTAATTAGC TATAAAGATG 480 

ATTCACAACA ATCATCTTTA TAGCTTTTTT ATGTCTAATT ATTTTTGAGG AAAATmACAA 540 

55 
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AATTTTATQT TTTCAAAAGT AAACAATCAA AAGATGTTAG AAGATTGCTT CTATATAAGA 660 

AAGAAAGTGT TTGTAGAAGA ACAAGGCGTC CCTGAGGAAA GTGAAATTGA TGAATATGAA 720 

TCTGAATCTA TTCACCTCAT TGGATATGAT AATGGACAGC CAGTTGCCAC TGCTCGAATA 780, 

CGCCCTATTA ATGAAACAAC TGTCAAAATA GAACGAGTAG CTGTGATGAA ATCACATCGT 840 

GGACAAGGAA TGGGTAGAAT GCTTATGCAA GCTGTAGAAT CATTAGCTAA AGATGAAGGT 900 
TTTTACGTAG CTACTATGAA TGCCCAATGT CATGCTATCC CATTTTATGA AAGTTTAAAC ' 960 

TTTAAAATGA GAGGTAATAT. ATTTCTTGAG GAAGGCATCG AGCATATTGA AATGACAAAA 1020 
AAGTTAACCT CGCTTAA1TA AAAAAAGTTG TATCTATTTT AGAAACA . ■ , 1067 
(2) INFORMATION FOR SEQ ID NO: 112: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 18613 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

<D) TOPOLOGY: linear ~ 



GCTGCTGGCT ACTTAGACAA GGAAATTATT TTAGGTATTC GAGCTGAAGA CATTCATGAA 
GAACCAATAT TTATTCAAAC TTCTCCAGAG ACACAATTTG AATCTGAAGT AGTTGTATCC 



60 
120 



25 ( X i) SEQUENCE DESCRIPTION: SEQ ID NO: 112: 

AAGACGtAtG ATAACAACAA TACgTGTAGT GAAAGATTTT AATCTACATA TTACTGACAA 
AGAATTCATT GTATTTGTTG GACCATCGGG ATGTGGTAAA TCAACAACAT TACGAATGGT 

30 ; TGCTGGACTA GAGTCTATCA CATCTGGAGA TTTTTATATT GATGGGGAAC GCATGAACGA 1B0 
TGTTGAACCA AAGAATAGAG ATATTGCGAT GGTATTTCAA AACTATGCAT. TATATCCACA 240 
TATGACTGTT TTTGAAAATA TGGCATTTGG GCTAAAGCTA CGTAAAGTAA ATAAAAAAGA 300 

35 

GATTGAACAA AAAGTTAATG AAGCAGCTGA AATATTAGGA TTAACTGAGT ATCTTGGTCG 360 
TAAACCAAAA GCGTTATCTG GCGGACAGCG TCAACGTGTT GCTTTGGGCA GAGCTATTGT 420 
TAGGGATGCG AAAGTCTTTT TAATGGATGA ACCATTATCG AATCTTGATG CGAAyTtCGA 480 
GTACAAATGC GCACAGAAAT ATTGAAATTA CATAAGCGAC TTAATACTAC GACAATTTAT 
GTTACACATG ATCAAACTGA AGCATTGACG ATGGCTAGTC GAATTGTTGT TTTGAAAGAT 
GGCGACATTA TGCAAGTCGG CACACCTAGA GAAATATATG ATGCCCCTAA TTGCATATTT 660 
GTGGCGCAAT TTATCGGCTC ACCAGCAATG AATATGTTGA ATGCTACAGT TGAAATGGAC 
GGATTGAAGG TAGGAACACA CCATTTTAAA TTACATAATA AAAAATTTGA AAAGTTAAAA 
50 ^^ATVTva^TvT-r TTnr^TIiTTr GAGCTGAAGA CATTCATGAA 840 



540 
600 



720 
780 



900 
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AAATTAGATT CAAGAACTCA AGTGATGGCG 
AATAAGTGTC ACTTTTTTGA TGAAAAAACA 
5 ATGTCTAAAA TTTTAAAATG TATCACGTTA 

TGTGGCCCTA ATCGTTCGAA AGAAGATATT 
GACAAGCCTA ACCAACTTAC GATGTGGGTG 

10 

AAAATTACGG ATCAATATAC TAAAAAAACT 
CAAAATGATC AACTAGAAAA TATTTCGCTA 

15 TTTTTCTTAG CACATGATAA TACTGGAAGT 

AAATTATCAA AAGATGAGTT GAAAGGTTTC 
GACAAT AAG C AACTAGCATT GCCAGCTATC 

20 AAATTAGTGA AAAATGCACC GCAAACGTTA 

ACTGATAGTA AAAAGAAACA ATACGGTATG 
TATCCGTTTT TATTCGGCAA TGATGATTAT 

25 ATTCATCAGC TAGGACTAAA TTCAAAACAT 

TGGTACGACA AAGGGTATCT TCCTAAGGCA 

AAAGAAGGAA AAGTAGGACA ATTTGTCACT 

30 - 

ACGTTTGGTA AAGATTTAGG AGTAACAACA 

CCATTTCTAG GTGTACGTGG TTGGTATTTA 

AAAGATTTAA TGCTGTATAT CACTAGTAAA 

35 

AGCGAAATTA CTGGACGTGT TGACGTGAAA 
AAGCAAGCAC GTCATGCTGA ACCGATGCCT 

40 CCGATGGGCA ATGCAAGCAT ATTTATTTCA 

GAGGCGACGA ATGATATAAC GCAAAATATT 
AAAGGAOATT AGTTATGACG AAAGGTAACC 

45 CTGGTTTGGG ACAGTTTTAT AATAAAAGAC 

TCATCAGTTT TATTTCTGTT TTTTATAGCT 

CATTAGGGAC AGTACCTAAG TTAGACGATT 

SO 

CTATCTTACT CGTTGCTTTC GCAATCATGC 

GTAATGCTGA ACGATTTAAT CGCAATGAGG 

55 



AACGACAAGA TTACACTAGC ATTTGATATG 1020 

GGAAATCGTA TCGTCTAAGG GGGAGTATTC 1080 

GCCGTGGTAA TGTTATTAAT CGTAACTGCA 1140 

GATAAAGCAT TGAATAAAGA TAATTCTAAA 1200 

GATGGCGACA AGCAAATGGC GTTTTATAAA 1260 

GGCATCAAAG TAAAGCTTGT AAATATTGGT 1320 

GACGCTCCTG CAGGAAAAGG TCCAGATATC 1380 

GCCTATCTAC AAGGCTTAGC TGCTGAAATC 1440 

AATArGCAAG CACTTAAAGC GATGAATTAT 1500 

GTTGAAACAA CCGCACTTTT TTATAATAAA 15€0 

GAAGAAGTTG AAGCTAATGC TGCCAAACTA 1620 

TTATTTGATG CTAAAAATTT CTATTTTAAT 1680 

ATTTTCAAGA AAAATGGCAG TGAATATGAT 1740 

GTCGTCAAGA ATGCTGAACG ATTACAAAAA 1800 

GCAAGACATG ATGTCATGAT TGGTCTTTTT 1860 

GGACCGTGGA ACATTAATGA ATATCAAGAA 192 0 

TTACCTACAG ATGGTGGCAA AC CTATG AAA 1980 

TCTGAATATA GTAAACATAA GTATTGGGCT 2040 

GATACATTAC AAAAATATAC AGATGAAATG 2100 

TCATCTAATC CAAATTTAAA AGTGTTTGAA 2160 

AATATTCCTG AAATGCGACA AGTTTGGGAA 2220 

AATGGTAAGA ATCCTAAACA AGCGTTAGAT 2280 

AAGATTCTTC AT CCATCACA AAATGATAAG 2340 

CTAAATTAGC GGCATTATTA TCTGTTATAC 2400 

CCATTAAAGG GACGATATTT TTTATCTTTT 2460 

TTTTAAATAT TGGTTTTTGG GGATTGTTGA 252 0 

CTCGTGTCTT ACTTGCACAA GGTATTATTT 2580 

TATATATCAT TAATATTTTA GATGCATATC 2640 

AAATAAAGGA TCCGAAGcGC GTATGGTGGC 2700 
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TGTAGTTGTA TTTCCATTAA TAyyTATGTT TGGAGTAGCA 


TTTACAAATT 


ACAATTTATA 


2820 




CAACGCGCCT CCGAGACACA CATTAGAATG 


GGTTGGTTTA 


GATAACTTTA AAACGTTATT ■ 


2880 


5 


CACAATTGGC GTTTGGCGTA AAACATTTTT 


CAGTGTTATT 


ACTTGGACAT 


TAGTATGGAC 


2940 




GCTTGTl'GCA ACGACACTTC AAATTGCATT 


AGGGCTGTTT 


TTGGCAATTA 


TTGTAAATCA 


3000 




CCCTGTCGTC AAAGGTAAGA AATTTATCCG 


TACTGTGTTA 


ATCCTACCTT 


GGGCTGTACC 


3060 


10 


ATCATTTGTG ACAATTTTAA TATTTGTAGC 


GTTATTTAAT 


GATGAATTTG 


GTGCX3ATAAA 


3120 




TAATGATATT TTGCAACCTT TATTAGGTGT 


AGCACCAGCA 


TGGTTAAGTG 


ATCCGTTTTG 


3180 


15 


GGCAAAAGTG GCATTAATCG GCATTCAAGT 


ATGGCTTGGA 


TTCCCATTTG 


TCTTTGCACT 


3240 


GTTCACTGGA GTACTGCAAA GTATTTCATC 


AGATTGGTAC 


GAAGCAGCAG 


ATATGGATGG 


3300 




TGCGTCTAGT TGGCAAAAGT TTAGAAACAT 


CACATTCCCG 


CATGTCATTT 


ACGCCACAGC 


3360 


20 


GCCATTGTTA ATTATGCAAT ATGCAGGTAA 


TTTCAATAAT 


TTTAATCTTA 


TTTATCTATT 


3420 




TAATAAAGGC GGTCCACCAG TGTCAGGGCA 


GAATGCTGGT 


AGTACAGATA 


TCTTGATATC 


3480 




TTGGGTGTAT AATCTGACAT TTGAGTTTAA 


CAACTTCAAC 


ATGGGTGCAG 


TTGTGTCATT 


3540 


25 


AATTATTGGA TTTATTGTTG CTATTGTCGC 


ATTTATTCAA 


TTCAGACGTA 


CAAGTACGTT 


3600 




TAAAGATGAG GGAGGTTT AT AAGATGACAA 


AGAAGAAAAA 


CAT ATT AAAA 


GCAATCGGTA 


3660 




TTTACAGTTT TATAGCGATG ATGTTTGTCA 


TCATTTTATA 


TCCACTACTG 


TGGACATTTG 


3720 


30 


GCATTTCCCT TAATCCAGGT ACGAACTTGT 


ATGGTGCCAA 


AATGATACCA 


GACAATGCAA 


3780 




CATTTAAAAA TTATGCATTC TTACTATTCG 


ATGACAGTAG 


TCAATACCTG 


ACTTGGTATA 


3840 


35 


AAAATACGCT TATCGTAGCA TCTGCAAATG 


CACTGTTTAG 


TGTGATATTT 


GTCACGTTAA 


3900 


CAGCATATGC TTTTTCTAGA TATCGCTTTG 


TTGGTCGTAA 


ATACGGGCTG 


ATTACATTTT 


3960 




TGATOTTACA AATGTTCCCT GTATTAATGG 


CAATGGTCGC 


AATCTATATT 


TTGCTAAATA 


4020 


40 


CAATTGGATT ATTAGATTCT TTATTTGGAC 


TAACACTGGT 


ATATATTGGT 


GGATCAATAC 


4080 




CGATGAATGC CTTTTTAGTG AAAGGTTACT 


TCGATACGAT 


TCCAAAAGAA 


CTTGATGAAT 


4140 




CTGCCAAAAT TGATGGTGCA GGGCATATGC 


GTATTTTCTT 


ACAAATTATG 


CTTCCATTAG 


- 4200 


45 


CTAAGCCGAT TTTAGCAGTT GTTGCTTTGT 


TCAATTTTAT 


GGGGCCATTT 


ATGGACTTTA 


4260 




TATTACCTAA AATACTATTA AGAAGTCCTG 


AAAAATTCAC 


ATTAGCAGTT 


GGATTGTTCA 


4320 




ACTTTATTAA TGATAAGTAT GCAAATAATT 


TCACAGTGTT 


TGCAGCAGGG 


GCAATTATGA 


4380 


50 


TTGCAGTACC TATAGCAATC GTATTCTTGT 


TCTTGCAACG 


CTATTTAGTA 


. T CAGGTTT AA 


4440 




CAACAGGTGC GACAAAAGGT TAGTTTGAAA TTAGGAGTGG 


; GGCAGAATTG 


ATAAAGAACC 


4500 
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GGGTGTGGTG 


GTATTGCGAA 


TGGCAAGCAC 


ATGCCAAGTT 


TACAAAAAGT 


TGAAAATGTT 


4620 




GAAATGATCG 


CATTTTGTGA 


CGT AGACATT 


TCGAAAGCAG 


CGAGTGCGGC 


AGAAGGATAC 


4680 


s 


GGAACTGACA 


ATGCAAAGGT 


TT ATG ATGAT 


TACAAAGCAT 


TGTTAAAAGA TGACACGATf 


4740 




GATGTTATCC 


ATGTTTGTAC 


GCCAAATGAC 


TCGCATTGTG 


AAATTACTGT 


AGCAGGGTTG 


4800 


10 


CATGCTGGTA 


AACATGTGAT 


GTGTGAAAAA 


CGAATGGCTA 


AAACGACAGC 


AGAAGCTCAA 


4860 


AAAATGATAG 


ATACAGCTAA 


ATCAACAGGT 


AAAAAATTAA 


CAAT AGGTTA TCAAAATCGT 


4920 




TTCCGAGCAG 


ATAGTCAATT 


TTTACATCAA 


GCAGCGCAAC 


GTGGCGACTT 


AGGAGACATT 


4980 


15 


TACTTCGGAA 


AGGCACATGC 


CATTCGTCGT 


CGAGCAGTAC 


CAACATGGGG 


TGTGTTTCTA 


5040 




GACGAAGAAG 


CTCAAGGTGG 


AGGACCATTA 


ATCGATATCG 


GTACACACGC 


TTTAGATTTA 


5100 




ACGTTATGGA 


TGATGGATAA 


TTATGAACCA 


GAATCAGTGA 


TGGGTTCAAC 


ATTCCATAAA 


5160 


20 


TTAAATAAAC 


AGCATCATGC 


GGCAAACGCT 


TGGGGTTCAT 


GGAATCCAGA 


TGAATTTACA 


5220 




GTTGAAGATT 


CTGCGTTTGG 


ATTTATTAAA 


ATGAAGAATG 


GAG CGACGAT 


CATTTTAGAA 


5280 




TCCGCTTGGG 


CGATTAATTC 


TTTAGAAGTG 


GATGAGGCAA 


AATGTTCATT 


ATCAGGAACT 


5340 


25 


AAAGCAGGTG 


CTGATATGAA 


AGATGGTCTA 


CGTATTCATG 


GTGAAGACAT 


GGGTACACTT 


5400 




TATACCAAAC 


ACGTTGAATT 


GGAAAACAAA 


GGCGTCGACT 


TTTATGAAGG 


TAATGAAGTG 


5460 




GATGAAGCTG 


AAGAAGAAGC 


AAAAGCTTGG 


ATTGATGCAG 


TTGTAAATGA 


TACTGAACCA 


5520 


30 


GTTGTGAAAC 


CGGAACAAGC 


AATGGTAGTT 


ACAAAAATTC 


TTGAAGCGAT 


TTATCAGTCT 


5580 




GCAAAATCAG 


GCAAAGCAAT 


TTACTTTGAA 


TAACATCATA 


CGGTAAGGAG 


GCACATCATG 


5640 


35 


ACAAAATTAA 


AAGTTGGTGT 


GATAGGTGTT 


GGTGGTATTG 


CACAAGACCG 


TCATATTCCA 


5700 


GCATTGCTGA 


AACTCAAAGA 


CACAGTCTCA 


TTAGTTGCAG 


TACAAGATAT 


TAATACAGTG 


5760 




CAGATGATTG 


ATGTTGCGAA 


gCGCTTTAAT 


ATACCTCATG 


CAGTTGAGAC 


ACCTAGCGAG 


5820 


40 


CTGTTTAAAC 


TTGTTGATGC 


GGTGGTCATT 


TGTACACCTA 


ATAAATTCCA 


TGCTGATCTT 


- 5880 




TCTATAGAAG 


CATTGAACCA 


TGGTGTCCAT 


GTATTGTGTG 


AAAAGCCAAX 


GGCGATGACG 


5940 




ACGGAAGAGT 


GTGATCG CAT 


GATTGAAGCG 


GCTAATAAAA 


ATCACAAATT 


ATTAACTGTC 


6000 


45 


GCATATt-AVL I 








AAAAAGCAAT 


TGAATCAGGT 


6060 




GTGGTTGGTA 


AACCTTTAGT 


AGCACGTGTA 


CAAGCGATGC 


GTAGGCGTAA 


AGTGCCTGGC 


6120 




TGGGGTGTTT 


TTACCAATAA 


AGCGTTGCAA 


GGTGGCGGTA 


GTTTAATCGA 


TTATGGTTG C 


6180 


50 


CACTTGTTAG 


ACTTATCTTT 


GTGGGTACTA 


GGTAAAGATA 


TGGTGCCGCA 


TGAAGTGCTA 


6240 




GGAAAAACAT 


ATAATCAATT 


GAGCAAACAA 


CCGAATCAAA 


TTAATGATTG 


GGGAACATTT 


6300 
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10 



15 



20 



25 



35 



45 



GCAAGCATGC 
AGTTTATCAG 
TTTGGAACTA 
AGACAGGCGC 
GAAGAAGCAC 
AAGAGCATAC 
GAGTGCTTTT 
GATATGTTAG 
AACCCAGGAG 
GGATTTATGA 
AATCCAATTT 
ATCCGTTTAG 
TCAGATGATA 
GAAATTTATG 
TTTGCAAAAG 
ACACCATATA 
GATCCTAGTC 
CAAGGAAATG 
AATATGTATG 
TTCCGTACAG 
ATTATTAATG 
GAAGAAGGTT 
GCAGACATGT 
ACTGGTGGCA 
TTAAATCAAG 
TACCCATTCA 
GGTATATGAT 
GGTTTCTGAA 
TGATGACAGG 



AGTTTGAATG 
GAGAAGATGG 
TTTTTGAAAG 
GTAACTTTGT 
GGAATGTAAA 
AACTTTAATG 
CAATGAAAAT 
ATTATGTCTC 
ATAAATTTTG 
AGTCAATCAC 
CTCCAGATCC 
CAAATCTATT 
CCGCTAAAAA 
ATTATCAGTG 
AGCAAGATGT 
CAATGTTGAA 
ATCTATGGTG 
CAATTCATCA 
GTCTAACTGA 
TTGGTT ATGG 
GATATGATTA 
TCCAAAAAGC 
GGTGGGCATA 
GTGTTGAATA 
TCATTGTTTG 
CAGTAACAAT 
AATAAAAAAA 
TATAATATTT 
CTTTCATCTT 



TTCGTGGTCT 
CGGTATCAAT 
CAAAGCTAAT 
CAATGCGTGT 
TGCCCTTATA 
ATTATCATAT 
AGGTGTATTT 
AGAATCTGGA 
TAAGTTAGAT 
AGACAGAGGC 
GATAGAAGCG 
AGACGTGCCA 
GCCTAATTGG 
GAATGAAAAG 
AAAAATTGCC 
GTTACGTGAG 
GCAAGGTATT 
CTTCCATGCT 
TATGCAACCA . 
ACATAGTCCA 
TGTATTAAGT 
TTGTCAAACT 
ATACGAACTC 
AATGCATATG 
TAAAGAAGGT 
CCTCACCATT 
GCCTGTTGTC 
CAGAATGCAC 
TTTAAATATT 



GCAAATATCA 
TTATTTCCAT 
GTTGAGCATA 
TTAGGGATAG 
GAAGCGATTT 
ATGATACAAA 
TCAGTATTAT 
TTGGATATGA 
GAGTTGTTAG 
TTACAAATAA 
AAAGAAGCCG 
GTTGTTAATA 
CCTGTTACAC 
TTGATACCAT 
ATAGAGTTGC 
GCTACAAATG 
GACCCAATTG 
AAAGATACGT 
TATGGTAACG 
TATGTATGGG 
ATTGAACATG 
TTGAAATCTG 
GAGGTTAGTC 
TCGGCAAGCC 
GTACTTTATA 
GAAAAGAGTA 
ACAATGGTCA 
TTTAAAGATG 
CATTAATTTC 



AAGAAGATAA 
TTGAAATATA 
ACGAAGACAT 
AAGAGATTGT 
ATCGTAGCGA 
ATTCTCAATA 
TTTACGATAA 
TTGAAGTTGG 
AAAATGAAGA 
GTGGTTTCAG 
ATGAAACGTT 
CATTTTCTGG 
CTTGGCCAAC 
ATTGGCAAGA 
ATGCAGGATT 
AATATATCGG 
CTGCGATTCG 
ATATTAATCA 
TTGCGACAAG 
CAGATATCAT 
AAGATCCTAT 
TTAATATTTA 
TGAAGTTTGT 
ATTGCCAAAA 
TAAGTATATA 
TATAACCTTT 
TAGACACGAC 
GACGTCGATG 
TCTTCTTGTT 



GGTTCACGTT 
TGAGCCCCGC 
TGCTGGTGAG 
GGTGAAACCG 
TCTTG ATAAC 
TAAAAAGAAG 
AAATTTTGAA 
AACAGGTGGT 
CAAGCGCCAA 
TTGTCATAAC 
ACGTAAAACA; 
CATTGCAGGA 
AGCCTACTCT 
TTTAGCTGAG 
TTT AGTG CAT 
TGCTAACTTA 
CATATTAGGC 
AGAAAATGTA 
AGCATGGACA 
AAGTCAACTT. 
TATGTCAGTA 
CGACAAGCCA 
CTGAAGTAAG 
ATTTCACACC 
GCGATGGTCA 
TCAATAGTGA 
ATACTTTAAA 
TAGACTAAAG 
TAATACGTAC 



6420 

6480 

6540 

6600 

6660 

6720 

6780 

6840 

6900 

6960 

7020 

7080 

7140 

7200 

7260 

7320 

7380 
7440 
7500 
* 7560 
7620 
7680 
7740 
7800 
7860 
7920 - 
7980 
8040 
8100 
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TAATACAGCG ATTAATTCAG GAATGATGTT 
ATATAATCCA GATTTAATAA TAGGATGGTT 
5 ACCACCTAAA GTTTTAATAA CCATAAATAA 

GCCAATACCA TTTGCAAAGC TAAATG TATC 
TACATAAATT AAAACGTGTG TTATTGCTAA 

10 

TGCACCGTCT GCTTTTAATT GTTTTGAGTG 
GATACAGAAA AAGATAAGTA ATATAGATAG 

r£ TGTATAAGCG TTGATTTTGA CAACATAAAG 

TTAACTATTT ATTAATTTTA GTACATAAAT 
TTTTGGATAA TTTAATAATT TTAAGGATAT 

20 CTTAACGAAA ATGATTGAGG TGACAGAGAT 

CAAAGGCATT CCATTATCGG TACAACGTAA 
CTTCGTAGTG TTCTTTGTTT AT ATGG CT AT 

25 ACAACCGTTT TTAAAAGAGG AAATTGGATT 

AGCATTTAGT ATCACGTACG GTTTAGGAAA 

TAACACAAAA CGTATTATCT CGTTCTTACT 

30 

GGGATTTGTT TTAAGTTACT TTGGTTCTGT 

TAACGGGGTG TTC CAATCAG TTGGTGGACC 

GCCAAGAACG AAACGTGGCC GATACTTAGG 

35 

TGCCATAGCA GGTGGTGTTG CACTTTGGGG 
AGGGATGTTC ATTTTCCCAT CGGTGATTGC 

40 CGGAAAAGAT GATCCGGAAG AATTAGGATG 

GGTCGATAAA GAAAATATTG ATTCTCAAGG 
TATCCTGGGA AATCCTGTTA TATGGATTCT 

45 ACGAATCGGT ATTGATAACT GGGCACCGTT 

AGGCGATGCA GTTAATACGA TATTCTACTT 

ATGGGGCTAC GTATCAGACT TATTAAAAGG 

SO 

G TTTATG ATT ACATTTGTTG TCTTATTCTA 

CATTTCATTG TTTGCATTAG GTGCGTTAAT 

55 



TAAGAAGTAA TTTGGGTGTT TTGTAATTTT 8220 

AGGTAAAATG AATAATTTTA ATGTCCAAAT 8280 

CATG ATATAA GCAAAGATTA ATATAACTAA 834 0 

TTTATTAATA AATGCCTGTA CACCAGCCAA 8400 

AAACTTCGAA TTTTTAACGC CATATTCAAC 8460 

ATTAATAGAT ATCTTTAAGC TGACAAGTCT 8520 

AATCATGATG TCCTCCGTCA TTATGTCATA 8580 

TATTTTATAG ATAAAGCTTG TCAAATACTA 8640 

ATGTTTCTAA GTATGTGTTT ATGTTCAGTA 8700 

TAAGCGCTTA CACCGACGTG ATATATTTGG 8760 

GAACTTTTTT GATATCCATA AGATTCCGAA 8820 

ATTATGGCTT AGAAACTTCA TGCAAGCTTT 8880 

GTATTTAATT CGAAACAACT TTAAGGCGGC 894 0 

ATCTACATTA GAACTTGGTT ATATCGGATT 9000 

AACATTACTT GGATATTTTG TCGATGGACG 9060 

TATCTTATCT GCGATTACAG TTTTAATTAT 9120 

AATGGGATTA TTAATTGTAC TTTGGGGACT 9180 

TGCAAGTTAT TCAACGATTT CAAGATGGGC 924 0 

ATTCTGGAAT ACATCACATA ATATCGGTGG 93 00 

TGCTAATGTA TTCTTCCATG GAAATGTTAT 93 60 

ATTACTTATT GGTATCGCAA CATTATTTAT 9420 

GAATCGTGCT GAAGAAATTT GGGAAGAGCC 94 80 

TATGACGAAA TGGGAGATCT TTAAAAAATA 9540 

ATGTGTTTCA AACGTCTTTG TATACATTGT 9600 

ATATGTGTCA GAGGATTTAC ACTTTAGTAA 9660 

TGAAATTGGT GCATTAGTTG CAAGTTTATT 9720 

TCGTCGTGCA ATTGTAGCTA TTGGCTGTAT 9780 

GACAAATGCT ACAAGTGTCA TGATGGTTAA 9840 

CTTTGGTCCG CAATTATTAA TTGGTGTATC 9900 
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CGCGTATCTA 
ACGTAACGGT 
CTTCTATGTT 
AAAGAAAATT 
- TGCAATATAG 
TTCTACCCTT 
AAGTATCCTT 
ATATAGCGGT 
ACTGAAAGAA 
GCCATAATCA 
ATTTGTAAAT 
TCTGCAATTT 
TAGCGATTTA 
TACGATTCAC 
GATTGCTTAA 
AGTGGTTGGA 
AATAAGGTAC 
AATAAATAAT 
CTCGATAATA 
TTTTTACGTG 
GATAATGCTT 
GGAATGATTT 
AACATCTACA 
CTTTGAAAAA 
ATGATTTAAT 
TTGCAGGCGA 
ACGTGCCAAT 
. AGCATTTTCT 
AGAACTTTCA 



TTCGGTGACT 
TTAAACATCT 
GCATTATTCC 
AGAAGTTTAA 
TTGGCAATCC 
GCAAATATAT 
ATTTGCCCGA 
GTCAATATTG 
AAGTGAAAAC 
TTAGTTATGT 
ATTTTTTAAA 
CATAGTGTTT 
AATAATCGAC 
TAACATCGAT 
TTTGATCCAC 
AGGCATCATG 
GGACAAGTCT 
CAAGAACATG 
TGATGACATT 
GCATACGAAT 
CAACACCATC 
GCTTTAATCC 
TTCCCCCTTG 
ATATGGAGTC 
CCCAAATGCT 
GATGACGACA 
GTCAGGCGTA 
ATGAGTGGCT 
ATATGGAGCT 



CAATGGCGAA 
TTGGATATAC 
TAGGCATGAT 
AAATTTAATA 
TGCCCCGACG 
CATCTCTATG 
CTTAGGGTGA 
TAGGGAGTAT 
TTCTCTATCA 
GCTAATCTAT 
ATGATAGCTA 
GTAATGTCGA 
AATTGTAATA 
ATGTTGAATT 
AATCTGGTTT 
ACAAGATGCT 
TCCTAAAATA 
ATGTTGAATG 
ACAATCTAGA 
ATCAGTAATT 
TTTAGCAGTG 
TTCTCGAATA 
AAAGTGGTAT 
GTGCATGTGA 
TAGTATCAAA 
TCCCGATACC 
TAGTAATGTC 
GAAGCATCAT 
TAATCATGTC 



AGTTGGTTTG 
ATTAAGTGGA 
TCTATTAGGA 
TAAATCGGAT 
GCATGTGCGT 
TCTCGGGGCA 
CTCAATGAAT 
TGTTTTATAT 
GTCCGCTTTT 
TTTGCTTGCT 
AACATTTTAT 
TCTAACAATT 
CCAACATGAT 
AAATCTGAAA 
ACATAATAAT 
AAGCTACGGC 
ACTTCTAATT 
CCGGCTTTGA 
TGCGCAATAT 
ACTAATTCTG 
TATATTGTAT 
ATTCGTTCAT 
TTTATAACAA 
ACCATATTGA 
TACATCATTA 
ATTGTCGCAA 
CAATGACTCA 
TTTACCAATT 
ATCAAAACGG 



GCGGCTATTG 
TGGACAGATG 
ATCGTTGCTT 
TAAAAGTATC 
GAAG AG ATG A 
GATCATAATT 
TTACTCCTTA 
TTAAACTCTC 
TCATAGAACA 
TACAATAATC 
ACTCTGAAAA 
GCAGAGATTG 
CTTTAAATGT 
CAGtCACTTT 
CATGGTATTC 
CGTTCTGTGA 
GTGCATGGTC 
TATATTCAAA 
CATTGAGTAA 
GCTGATGTTG 
TGAAATGATA 
CATCACAAAT 
ATTAACGTAC 
ATGATTGCTT 
TTAAGAGATT 
ACTAAAACAT 
GTATCTCTAC 
GTCTGGTGAC 
aTGTTTTGTA 



CTGATCCAAG 
TTTT CATCGT 
TCTATGAAGA 
GCCAATCTAT 
AAGATACTGC 
CCCTGTTATG 
CAATAAAGAC 
TAAAAAGCGG 
AAATGGAGGC 
ACTTGGCGAC 
GCCTACTTTG 
TAAAATACGA 
TCGCATCGCA 
CGTTTGATAA 
TACTTTTAAT 
TTGTTGCTCT 
TACTGGTTTT 
GTCATCGTAA 
ATCGACGCCA 
TTGAATTAGT 
GTCTCCCCAA 
AACTACCTTA 
CTTGATTACG 
TATTGTGTAA 
GGCGTACATA 
GTAAATTCTG 
CATGTTTAAT 
GCGCTTCTTC - 
TTGCAACATA 



10020 

10080 

10140 

10200 

10260 

10320 

103 80 

10440 

10500 

10560 

10620 

10680 

10740 

10800 

10860 

10920 

10980 

11040 

11100 

11160 

11220 

11280 

11340 

11400 

11460 

11520 

11580 

11640 

11700 
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GTAACGTAAC 


ATTTGCGATA 


ATTGTTGGAC 


CACAGTTtGT 


GCTAATTTCG 


GAGATAACGT 


11820 




AATTAAATAT 


TGTATTGTTT 


GCATCGTATT 


GAATAGGAAA TGAGGCTGGA 


ATTGGCGTTC 


11880 


5 


TATTTCCTTT 


AACTGAATAT 


CACGCAAGCG 


ACGTTCTGTA 


TGCTCGATAG 


AATGGATCAG 


11940 




TTGCTCATTT 


GATTCAAATA 


AATCGTAAAT 


ATAATTATTA 


ATTTCTTCTA 


GTTCACTGTT 


12000 




GTTTTTTAAA 


GGCGTATATG 


TACCTAGATG 


ACGATTTTTG 


GCATAGTAAA 


TTTmXJAAT 


12060 


10 


AATCGTTTCG 


ATATCTTTTG 


TTTGTCGTTT 


AGCCATATTA 


TCTGCGCTAA 


TGAAACCAAA 


12120 




TATTACTAGT 


AAAACAAGAA 


CTACGGCCAT 


AACAATTAAC 


AACGTGATAC 


CATCTTCAAT 


12180 


is 


GTTTTCATGT 


ATATCTTTAT 


AAATAATGAG 


ACGATGGTCA 


GCATGGTTTA 


ATTTTACAGA 


12240 


TTCATTCATA 


AATCCGAATT 


GTTGTGGTcT 


AT ACTTTT CA 


CCTATAGTAA 


AACX3GTCATC 


12300 




GTTGGCGTAT 


AAAATATTGT 


CATATTGATC 


AmCGATAAGT 


GCGAATTGTC 


GGTTATCTTT 


12360 


20 


CtTAATTTCA 


CTTAAACGTG 


GGGTGTt AGC 


CATATAAATt 


TTaAGCATAT 


ATGTACTATT 


12420 




TTTGAATTTA 


AGCTGATGCG 


TTGAAAATAA 


ATACATATTT 


TTAGTGTTTA 


AATGTTCATA 


12480 




ATTATTGGTT ATAAACTGAT 


TTGGTCCAGA 


TAATTCATAA 


TAAAGTGTTG 


CGGGCTGTTG 


12540 


25 


GkGTATTAAT 


TTTAATAATT 


CACGTTTTGT AGCGGTCACA TCATGATGAT TTGyTAAATC 


12600 




GAGCTCTTGA 


AACGAATTAT 


TATGCTGTGT 


AATAAATGTG 


TGAATCTGCT 


TTTCAGTATG 


12660 




ATGTAAAGAT 


GACTGACTTT 


CATCAACATG 


TTGATGAATC 


GTACGATGCT 


CAATCCAAAT 


12720 


30 


ATAGATGGCA 


TAGAAGCTTA 


CTAGTCCAAT 


AATAATGACT 


AAAAATACTG 


GAAAAATAGT 


12780 




AGACnCAAAT 


AACGATCGTC 


TTAATTGATG 


TCTATAAGGT 


TTGTATG CCn 


TCATTGAATC 


12840 


35 


ATCTCCAAAA 


ATTTATGATG 


TGGAATATCC 


GGTAATTTAG 


ATTTCGGTAT 


TAAAGGTATG 


12900 


TTCTTAAGAT 


TTTCGATAGA 


GTGAT CGCTT 


TGTTCACTAA 


CATCCTTTCG 


AATTGACTTG 


12960 




GCATCGAACT CTGCAACTAA TCGTtGTTGT 


ACTGAGCGGC 


TTGTTAAATA 


TTGCACTAAC 


13020 


40 


TTTTTACGCT 


TAGGATGAGG 


GTGTGCATTT 


TTAACTAAAG 


CAATrCCATC 


AACATTTAAC 


13080 




ATTGTTCCTT 


CAATTGGATA 


AACGATTGAT 


ACAGGATAAC 


CTTTGTTTTT 


CCATGTGCGT 


13140 




GCATCTTGTT 


CGTAGCTTAG 


ACCTGCGTAA 


TATTTACCTT 


TTGCAACATC 


TTCAATGACT 


13200 


45 


TTAGACGTCT 


TTGACAGTTG 


CATCG CATGG 


TTTTGGAATT 


GATGCACATC 


ACTTACTCGA 


13260 




TGATGGATGC 


TATAAATAGC 


ACGCATATGT 


TGATAGCCTG 


TCGTTGTTGT 


ATTTGGATTT 


13320 




GAGTACGCAA 


TTTTACCTTT 


AAGTATAGGT 


TGTAATAAAT 


CTTGATAACC 


TCGAATCTTA 


13380 


50 


ATATCTCCTT 


GTAAATCTGA 


ATTCACTACT 


ATAACTGTTG 


GCATTAATAG 


AAAACTAGTA 


13440 




ACATATTTAT 


TGTTCGAGCG 


ATAATCCTCT 


AATTGCTGTG 


TTACAGATGT 


ATCTTGATAG 


13500 
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CCACGCTCCG AAAAATCTTC GTTATGCAAG TTTGAAAGCA GTACTTGAGT 
TTAATTTCAA TTTTGACATG CTCTTGTTTT TCAAATTCAT TTAAAATTGG 
TTTGATTGAT ACGGAGAATA AACTGTTAAT ACATTTTTAT CGGATTCAGA 
TTAGCGCATG CTGaTAAAAA AATGAGAAAT AATAGCAAGA TATAAATTTT 
ATATCCCATC AATTCTATGT ATATTTTAAT ACAATAATTT TAGCAATAAA 
GTAATGTTAA ATATTTAGAA ATGTTTATAG ATGACTTGTT AAGACGTTGC 
ATAGCACAAA ATTTTTGTTT GTCAAGACGA TTTACCGAGG CTGTAAAATC 
ATTTTATTTG TAGCTGTTAT ATAAAAATCG GCAAGATATT GAACGGTTCA 
TTTACGTCAA TAAAAGTATT TAATCCAGTC TCTTCATATA TAAAAGTAAA 
TGTTGATTTA ACGCTTATCA ACAATCATTT TTTATAAACA AATATATACT 
CTTTTAAAGC AATGAAAATA GTGAACATTA TAACTGTTGT GTAACAGAAT 
TATTACTGTT ACACAAATTA GTACAGTTTC TATGTTTTGA CATACATTTG 
TACATAATTT ATGTGAAAAA AATCACAACA AACATGCTAC AATGACTATG 
CATAGCATTT CAAATTCACA ACATTATACA " GATGGAGGCG TTTAGTATGT 
TaAAAATCAT GCAACAGCTT GGCAAGGATT TAAAAATGGA AGATGGAACA 
. TGTAAGAGAG TTTATCCAAT TAAACTACAC TCTTTATGAA GGTAATGATT 
AGGACCAACA GAAGCAACTT CTAAACTTTG GGAACAAGTA ATGCAGTTAT 
ACGTGAACGT GGCGGCATGT GGG AT ATGG A CACGAAAGTA GCTTCAACAA 
TGATGCTGGT TATTTAGACA AAGATTTAGA AACAATTGTA GGTGTACAAA 
ATTCAAACGT TCAATGCAAC CATTCGGTGG " TATTCGTATG GCGAAAgcAG 
TTACGGTTAC GAATTAGACG AAGAAACTGA AAAAATCTTT ACAGATTATC 
TAACCAAGGT GTATTCGATG CATATTCTAG AGAAATGTTG AACTGCCGTA 
AATCACTGGT TTACCTGATG CATACX3GACG TGGACGTATT ATCGGTGACT 
AGCTTTATAT GGTGTAGATT TCTTAATGGA AGAAAAAATG CACGACTTCA 
TACAGAAATG TCAGAAGATG TAATTCGTTT ACGTGaAGAA TTATCAGAAC 
ATTAAAAGAA TTAAAAGAAC TTGGACAAAA ATATGGTTTC GATTTAAGCC 
AAACTTCAAA GAAGCAGTTC AATGGTTATA CTTAGCATAC CTTGCTGCAA 
AAACGGTGCA GCAATGAGTT TAGGTCGTAC ATCAACATTC TTAGATATCT 
TGACCTTAAA GCAGGCGTTA TTACTGAAAG CGAAGTTCAA GAAATTATTG 



AGATCCGTGT 
ACGAATCAAG 
GTGACGCGTA 
TGATTTCATG 
TGACGCATAA 
AAATGTTGTG 
AAACTGTTAT 
AAAGTGAATT 
TCTTTCTAAG 
CCTAAATTAA 
GCAATTAGCA 
ATGAAAATTG 
AAAACGTTAA 
TAGAAACAAA 
GACACGTAGA 
CATTTTTAGC 
CGAAAGAAGA 
TCACATCTCA 
CTGAAAAGCC 
CTTGTGAAGC 
GTAAAACACA 
AAGCAGGTGT 
ATCGTCGTGT 
ACACGATGTC 
AATATCGTGC 
GTCCAGCAGA 
TTAAAGAACA 
ATGCTGAACG 
ACCACTTCAT 



13620 
13680 
13740 
13800 
13860 
13920 
13980 
14040 
14100 
14160 
14220 
14280 
14340 
14400 
14460 
14520 
14580 
14640 
14700 
14760 
.1482 0 
14880 
14940 
15000 
15060 
15120 
15180 
15240 
15300 
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AGACCCAACT TGGGTAACTG AATCTATCGG TGGTGTAGGT ATTGACGGAC GTCCACTTGT 15420 

TACGAAAAAC TCATTCCGTT TCTTACACTC ATTAGATAAC TTAGGTCCAG CTCCAGAACC 15480 

AAACTTAACA GTATTATGGT CAGTACGTTT ACCTGACAAC TTCAAAACAT ACTGTGCAAA 15540 

AATGAGTATT AAAACAAGTT CTATCCAATA TGAAAATGAT GACATTATGC GTGAAAGCTA 15600 

TGGCGATGAC TATGGTATCG CATGTTGTGT ATCAGCGATG ACAATTGGTA AACAAATGCA 15660 

ATTCTTCGGT GGACGTGCGA ACTTAGCTAA AACATTACTT TACGCTATCA ATGGTGGTAA .1572 0 

AGATGAAAAA TCTGGTGCAC AAGTTGGTCC AAACTTCGAA GGTATTAACA GCGAAGTATT 15780 

AGAATATGAC GAAgTATTCA AGAAATTTGA TCAAATGATG GATTGGCTAG CAGGTGTTTA 15840 

CATTAACTCA TTAAATGTTA TTCACTACAT GCACGATAAA TACAGCTATG AACGTATTGA 15900 

AATGGCATTA CATGATACAG AAATTGTACG TACAATGGCA ACAGGTATCG CTGGTTTATC 15960 

AGTAGCAGCT GACTCATTAT CTGCAATTAA ATATGCACAA GTTAAACCAA TTCGTAACGA 16020 

AGAAGGTCTT GTAGTAGACT TTGAAATCGA AGGCGACTTC CCTAAATACG GTAACAATGA 16080 

CGACCGTGTA GATGATATTG CAGTTGATTT AGTAGAACGC TTCATGACTA AATTACGTAG 16140 

TCATAAAACA TATCGTGATT CAGAACATAC AATGAGTGTA TTAACAATTA CTTCAAACGT 16200 

TGTATACGGT AAGAAAACTG GTAACACACC AGACGGACGT AAAGCTGGCG AACCATTTGC 16260 

TCCAGGTGCA AACCCAATGC ATGGCCGTGA CCAAAAAGGT GCATTATCTT CATTAAGTTC 16320 

TGTAGCTAAG ATCCCTTACG ATTGCTGTAA AGATGGTATT TCAAATACAT TCAGTATCGT 16380 

ACCAAAATCA TTAGGTAAAG AACCAGAAGA TCAAAACCGT AACTTAACTA GTATGTTAGA 16440 

TGGTTACGCA ATGCAATGTG GTCACCACTT AAATATTAAC GTATTTAACC GTGAAACATT 16500 

AATAGATGCA ATGGAACATC CAGAAGAATA TCCACAGTTA ACAATCCGTG TATCTGGTTA 16560 

CGCt&TTAAC TTCATTAAAT TAACACGTGA ACAACAATTA GATGTAATTT CTCGTACATT 16 620 

CCATGAAAGT ATGTAACAAA ATTTAAGGTG GGAGCACTAT GCTTAAGGGA CACTTACATT 1668 0 

CTGTCGAAAG TTTAGGTACT GTCGATGGAC CGGGATTAAG ATATATATTA TTTACACAAG 16740 

GATGCTTACT TAGATGCTTG TATTG CCACA ATCCAGATAC TTGGAAAATT AGTGAGCCAT 16800 

CAAGAGAAGT CACAGTTGAT GAAATGGTGA ATGAAATATT ACCATACAAA CCATACTTTG 16860 

ATGCATCGGG TGGCGGTGTA ACAGTCAGTG GTGGCGAACC ATTGTTACAA ATGCCATTCT 16920 

TAGAAAAATT ATTTGCAGAA TTAAAAGAAA ATGGTGTGCA CACTTGCTTA GACACATCGG 16980 

CTGGATGTGC TAATGATACA AAAGCATTTC AAAGGCATTT TGAAGAATTA CAAAAACATA 17040 

CAGACTTGAT ATTATTAGAT ATAAAACATA TTGATAATGA CAAACATATT AGATTGACAG 17100 
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TATGGATTCG 


ACATGTCCTT 


GTGCCTGGTT ATTCTGATGA 


TAAAGACGAT 


TTAATTAAAC 


17220 




TAGGGGAATT 


TATTAATTCT 


CTTGATAACG TCGAAAAGTT 


TGAAATTCTG 


CCATATCATC 


17280 


5 


AGTTAGGTGT 


TCATAAGTGG 


AAAACATTGG GCATTGCATA 


TGAATTAGAA 


GATGTCGAAG 


17340 




CGCCCGATGA 


TGAAGCTGTT 


AAAGCAGCCT ACCGTTATGT 


TAACTTCAAA 


GGGAAAATTC 


17400 


10 


CCGTTGAATT 


ATAAATACAA 


TTCAGACCGA AAAGAAAGCA 


TATGCAACTT 


CAAGAGTGAA 


17460 


GGGGCATATG 


CTTCTTTTTC 


AATTGAGTAT TGAGT ATT AG 


CAAGACGTAG 


TAAGTATATG 


17520 




AGACAACTTC 


TACAATGGTT 


GAAGGAAGAC GTTTTTGTAA 


GTAGCTATGC 


TGATAAAGAA 


17580 


15 


TGTGATGTCT 


TGTTAAAGGT 


GGGGTTCCAA TATCATCATT 


TAGCTGATGT 


TGAATGGGTT 


17640 


ATT ATTTG CT 


ACTTGCATAT 


GAATATGAGT CTTTTCAAAT 


TTTTATTGAC 


CCTGAGTAAT 


17700 




GAAAAATATT 


AAGATGAAAC TTAATATTAA AgCAATGCGG AGCGTGATTA 


TGAAGAGAAT 


17760 


Of\ 
izU 


TAGTAAAGAT 


ATATGGGCAG 


TATTTAAATT ACTGTATCaA AATAAAGGGC 


GTTTTAGCAT * 


17820 




TAATGCCTTA 


CTATTGCAGT 


TAATCATGAT TTTTATTAGT AGTACATACT 


TAATTTTACT 


17880 




ATTTAATATG 


ATGTTAAAAG 


TAGCTGGcAA AGCCAACTTA 


CGATTAACAA 


TTGGACGGAA 


17940 




ATCGTTAGTC 


ATCCCGCCAG 


TGTGATACTT CTTATTATAT 


TCATATTAAG 


TGTTGCCTTT 


18000 




CTGATTTATG 


TAGAGTTTTC 


ATTGTTAGTT TATATGGTTT 


ATGCCGGCTT 


TGATCGACAG 


18060 




ATTATTACAT 


TTAAATCCAT 


TTTTAAAAAT GCCTTTGTAA ATGTGCGTAA ACTCATAGGT 


, 18120 


30 


GTAC CAGTT A 


TTTTCTTTGT 


CATTTATTTA ATGTTAATGA TACCCATTGC 


CAACCTAGGA '-' 


16180 




CTAAGTT CAG 


TATTAACAAA 


AAATATTTAC ATACCTAAAT 


TTTTAAOGGA 


AGAACTTATG 


18240 


35 


AAAACGACGA 


AAGGTATAAT 


CATTTACGGT . ACCTTTATGA 


TTGCTGTATT 


TAT ATT AAAT 


18300 


TTTAAATTAA 


TATTTACTCT 


ACCGTTAACG ATTTTAAACC . GCCAGTCX3TT ■ ATTTAAAAAT 1 


18360 




ATGAGACTAA 


GTTGGCAAAT 


TACGAAGCGA AATAAGTTTC 


GG CTTGTT AT 


AGAAATAGTT 


18420 


40 


ATATTAGAAC 


TCATCATTGG 


TGCGATTTTA ACATTAATTA 


TTTCAGGAGC 


AACATATCTT 


. 18480 




GCTATTTGTG 


TAGATGAAGA 


AGGAGATAAG TTTTTAGTCT 


CATCAATTTT 


ATTTGTTGTA 


18540 




TTGAAAAGCG 


CATTGTTCTT 


CTATTATkTA TTtACGAAAT 


TATCATTAAT 


CAGTGTGTTA 


18600 


45 


GTACTGCACT 


TAA 








18613 




(2) INFORMATION FOR SEQ ID NO: 113: 









(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1214 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: .113: . . , 

AAAGTTTTAA AAGGGGTGAG ATACTTGGCG AATAATCCAT TCCAGCTTTG CGTTTAAAAG 60 

5 GAATTATACT TGCCATTGTC GGTGCTTGTT TATGGGGATT AGGTGGTACT GTTTCTGATT 120 

TCTTGTTCAA ATATAAGAAT ATTAATGTCG ATTGGTACGT CACTG CTCGA CTTGTAGTCA 180 

GTGGTGTTTT CTTACTTATT ATGTACAAAA TGATGCAACC CAAACGTTCA ATATTTAGCG 240 

10 

TATTCCAAGA TCGACGTATG TTAGGCAAAT TACTTATCTT CAGTATACTG GGCATGTTAG 300 

TAGTACAATA TGCTTATATG GCATCTATTA ATACAGGTAA TGCTGCGATT GCAACATTAC 360 

TACAATACAT TGCGCCAGTT TATATTATTA TTTGGTTTGT CATAAGAGGC GTTGCAAAAC 420 

15 

TAACATTATT TGATGTGCTT GCTATTATCA TGACACTATT AGGAACATTT TTATTATTAA 480 

CAAATGGTTC ATTTTCTAAT TTAGTCGTCA ATCCTGCAAG TTTATTCTGG GGTATTTTAG 4 540 

2Q CTGGTGTAGC . ACTCGCTTTT TACACAATTT ATCCTTCAGA CCTACTTAAC CGCTTCGGTT 600 

CGATTCTAAT TGTCGGGTGG GCAATGCTTA TTTCTGGTGT TGCGATGAAT TTACGCCATC 660 

CAATTTGGCA CATTGATATC ACTAAATGGG ACATATCAAT TATATTATTT TTAAT C TTTG 720 

25 GTATTATCGG TGGTACCGCA CTCGCATTTT A TT TC TT TAT CGACAGTTTA CAATACATAT 780 

CAGCGAAAGA AACAACATTA TTCGGAACTG TTGAACCTGT CGTAGCCGTT ATCGCAAGCA 84 0 

GTCTATGGTT ACATGTGGCA TTCAAACCAT TTCAAATCGT AGGCATCATT CTTATTATGA 900 

on 

TTTTAATTTT ATTACTATCA CTTAAAAGAC AACCTGAAAC ATTAGATGAA TAAGAAAACT . - 96 0 

CTGAT AATCA CTTTAGCAAG TAACTATTAT TTAACAACGT AGTTACCTTA TAGGTGATAT .1020 

CAGAGTTTTT TATTTTAGTT AATAATATTT TTCACTTGGT ATAAAAAaGC GTCGTCGCTC 1080 

35 

TGGTAATCGG AAATACTGGA ATAAAATATG GAATTGGGTA ATAATCCCAG GTAnTAAAAG 1140 

TCCATGTTCC GATAnCCTnT CCGCAnCTCC AACCAAATTT GCCGATAAGG TTCCAAAAGG 1200 

CATCCTGGGG GTAC x 1214 

40 

(2) INFORMATION FOR SEQ ID NO: 114: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 9458 base pairs 
45 .. (B) TYPE: nucleic acid 

<C> STRAND EDNESS : double 
<D) TOPOLOGY: linear 

50 Cxi) SEQUENCE DESCRIPTION: SEQ ID NO: 114: 

ATTTTGGTTT CATTCACGAT GGGGTnATAC AGCAAACACA nCTAAAATAA CTATCAATAG 60 
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CTTAGACAAT AAAAAATATG CCACTACAAT 


CGCTAATATT ACGATTAAAA AAGAAGCGTT 


-180. 




AACGATTACT TTCATCGTTG TTCTATGTCT GAACATCATA TTAAAGACAA CTAGACTAAT 


240 1 


5 


TGATAATGAA ACAGCAAAAA AAGTAATAGC 


TAACACTAAT TTCATGATAA ATAGACAGAC 


• 300 




TAAACCTATG ACTAATAATG T ATTAGAAAT TACAGCTGAC GTTTTTAACA TTCTCGaATT 


■360 




AATATGCACT 


CACCCTTTTT ATTTAAATAA 


CTTACATAAT CATAATAATA CATGATGTTT 


420 


10 


CATAGGCCTG 


TCGATGATTG ATTCACAATA 


GCACGTGATT TTTTTGTTTT TCAATATTAT 


480 




TCATTTATTC 


CATCAAAAAC ACCCTTTTTA ATTTTTACAA AAATTAAAAA AAGTGCTCCT 


540 


15 


ACACTGCTTG 


CATGTAGAAA CACTTTTTCA TTGTAATGTT ATTCTTCTCG AGACATACCT 


600 


TTTAGCATAT 


TAAGCATGTA TGTTAAACTA 


CGGTTCATGT CGTCATCTTT CAATACGCCC 


660 




AATAGACTTC TTATAGTTGT CTTAGCATTT GGACTCGCTT GATTGGCAAC GTGTAATCCT 


720 


20 


TTATTAACTT 


TATTTAGGAA GTCGCTTAAA TCTGATACAT TGAGTTCACC TAATAAAAAT 


780 




ACCATTGAAG 


CCATATTAGA TAATAGCCCT 


GTATAAATAT CTTTATTAAG TTCAACTGCA 


840 




AATTTATTTA 


TGATGACTTG ACGTCCTCGA ATTGCACGAT TTAAAGCATC TAATAGTTTT 


900 


25 


GCATCATCTA 


ATQTTTTAAT AAGCTTGATT 


GCTTTTAATA TACTATCTTT ATTCGCTGCA 


960 




ATTGCCTCTG 


TAACTTCATT TAAACTTTCT 


AACTTAATTT GTTCTTCTGA TTTTTCTAAG 


1020 




CGTCTAATTT 


TAGAAGATAT TCTCTCAGCG 


ATTATTTATC GACCTGATTT CCGGGGAAAA 


1080 


30 


CATAATCTGA 


ACGTTGCCAT TTTTTCTGTA 


CTTGAACACT GTACTGGGGT TGACGTTTTT 


1140 




TATTGACACG 


GAAATTATTA GGGTTCAACG 


GTGACTTACC ACGTTTCGTA ATTACCTCCA 


' 1200 




AACGACAGCT 


AGTACGTTTA TAAGATGGTG 


TATCCGTGTA TTGATCAACA TCACTaTTAG 


1260 


35 


TTAATAAGTT AATTGCACCT AGATCTCCAT- TTTCCATCGC -aTCaTTATTT AATGGAAT AT 


'1320 




AGATTTCTTT 


ACCTTTAACA CGATCTGTCA 


CGTGAACTTG TAATACCGCT TCTCCTGTyT 


1380 


40 


CAGAAATCAG 


CTTAACTTCT GCACCTTCAT 


GAATGCCTCT ATCTTCAGCA AGCTCTGGAG 


1440 


AAATTTCAAC 


AAATGCACGT GGCACTTTGT 


ATTTAATCAT TGGTGTTTGA TAAGTCATAT 


1500 




TACCTTCATG 


GAAGTGCTCT AACAATCGAC 


CATTGTTTAC ATGAATATCA TAAATTTCAT 


1560 


45 


CTTGCTTAAA GTAATTATCA AATGATAATG 


GGAATAATTT TGCTTTACCA TTATCAAAAT 


1620 




TGAATCCTTC 


TAAGTATAGA ATAGGCTCAT 


CAGTACCATC AGGTTGTACT GGCCATTGTA 


1680 




AACTATTGAA 


TCCTTCTAAA CGATCATAAC 


TTACCCCAGC ATATAGAGGT GTTAAGCGTG 


1740 


50 


CTACTTCATC 


CATAATTTCA CTAGGATGCT 


TGTAATTCCA ATCAAATCCT AAT CT ATT AG 


1800 




CAATTGCTTG 


GAAAATTTTC CAGTCAGGTT 


TTkAATCACC AAGAGGTTCT AATGCTTGGT 


1860 
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TTGCTGGCAA TACAACATCT GCGTATGTTG CTGTGAATGT TAAAAATTCA TCTTGGACTA 1980 

CCATGAAATC TAATTTTTCA AACGCAGCTT GTACAAAATT AATATTTGAA TCCACAATAC 2040 

5 

CCGTATCTTC ACCATATAAG TACAATGAGT GTACTTCTCC GTCATGTATA CCTTCTACCA 2100 

TTTCATGATT ATCTTTACCA GCTTTTGGAT TCAATTTAAC GCCATATTCT TTTTCAAATT 2160 

TAGCGCGAAT ATCATCCGCT TCAATACTTT GATAACCAGT AATCTTATCA GGGATACTTC 2220 

10 

CCATATCACT ACATCCTTGA ACATTATTAT GTCCACGTAA TGGATACGCA CCAGTACCAG 2280 

GACGACGATA ATTACCTGTT ACTAATAATA AGTTTGAAAT CGCTGTACTT GAGTCACTAC 2340 

1S CAATGTCTTG TTGTGTAATA CCCATTGCCC AACAAATTAC AACAGATTCA GCTTTAGCAC 2400 

ATTCTTCAGC AAATTTAATC AATTCTGATT CAGGAATACC TGTTGCTTCT TCAGCAAAAG 2460 

CCATTGTAAA TGTTTCTAAT GATTTGTAAT ATTCATCAAA ATCATCTACC CACTCATCAA 2520 

20 TAAATGCTTT ATCGTGTAAA TCATGATCAA TAATATACTT AGTCACTGCA CTTAACCACG 2580 

CTAAATCCGT AGCTGGTTTA GGTTGATAAA AACGATCCGC ACGTTCTGCC ATTTCATGTT 2640 

TTCTAATATC AAATACATGT ATTTTTTGAC CAAATAATTT TTGTGCACGT TTCATGCGTG 2700 

25 ATGCGATAAC TGGATGAGCT TCGGCTGTAT TAGTACCTAT CAATACAGAC ATTGCCGCTT 2760 

TTTCTAAATC TT CAAT ACT A CCTGAGTCAC CGCCGTGTCC AACCGTTCTA AATAAG CCTT 2820 

TTGTTGCAGG TGCTTGGCAA TATCTTGAAC AGTTATCAAC GTTATTTGTG CCAATAACTT 2 880 

30 

GTCTTGCTAA TTTTTGCATT AAATACGATT CTTCATTCGT CGCTTTAGAA GAAGAAATGA 2940 

ATGATAGTGG ATCTGGGCCA TGCTTTTCTT TAATAGCTGT AAAATTATCT GCAATGACGT 3000 

TTAAAGCTTC ATCCCATTCT ACTTCATGGA ACTCACCATT TTTCCTTACT AGTGGTTTAG 3060 

35 

TTAATCGTTG ATCTGAATTA ATATGTCCCC ATGAAAACTT ACCTTTAACA CAAGTCGCAA 3120 

TTTTATTTGC TGGAGAATCA TGTGATGGTT GTACTTTTAA AATTTCTCTA TCTTTAGTCC 3180 

40 AAACTTCAAA TGAAGAACCC ACACCACAAT AAGTACACAC TGTTTTAGTT TT CTTAAT AC 3240 

GCTCTTTACG CATTTCTGCT TCTGAATCTG AGATTGCAAA TAGTGGACGA TAACCAGGTT 3300 

CTGCTTTTTT AGTTAAATCA ATCATTGCTG CTAATGAACC AGGTTCCGTA TCAGTCATAT 3360 

45 AACCCGCATT ACCTTCCATA TTCACTTCCA TCATGGCATT ACATGGACAT ACCGTCGCAC 3420 

ATTGACCACA AGATACACAT GAAGACTCAT TAATCGGTAC ATCATTATCC CAAATAACAC - 3480 

GTGGATGTTC ACGATCCCAA TCAATTCTAA TAGTTTCATT CACTTCGATA TCTTGACATG 3540 

SO 

CTTCTACACA ACGCCCACAT AAGATACATT GATTTGGATC ATAACGATAA AATGGGCCGT 3600 

AATCTTTTTC GTATGGCTTC TCTTTATATT CATACGTTTG ATGCTGAAGC CCCCATGCAT 3660 
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40 
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SO 



TATGCTTTTC 
CAGTATTTAC 
CAATCTCAAC 
TTGAAGGTAC 
CAAGATAATC 
CTATATATAT 
TGCCCCACAC 
AAGTAAAATT 
ATTAAATCAT 
TTTCACGCTT 
CACCTAAAAA 
TTGATAAATA 
GATTAATTTA 
ATCACCTTCT 
CTAATTAATT 
TCTTTTAATA 
CCGTCACTTT 
TCTTTATAAT 
TTTTGAATTT 
TTGGCCATCG 
CCITCTTCTT 
TGTCCTTTTG 
CCGCCGATGC 
ATTGGCACAT 
TAGGCATGTG 
GGTATACTTA 
tCACTACGCT 
G CGATTGTG A 
TTGCGATCTA 



TAAAATTCGA 
AGTCATTGGA 
AGTACATGTA 
AAAAGTATCT 
TTTTCCATCA 
TTTCCGTAAA 
ATCTTTCAGA 
TTGTATTTTG 
CTTTTTGTTT 
TTTGCCATAT 
TCGTTATACT 
TCTACT AT CA 
TAAAAATCAA 
ATTTACGGGC 
TGTGTACAAT 
ACTTAGTACT 
GAATGCCGCC 
TGCTTCTAAT 
CATTCATTAG 
CTTCAAGCAC 
. TACGACTTCT 
TAAAACGAAC 
TATCTATCAT 
TCATTAATTT 
CAATTTTTTC 
CTATTTCAGT 
CTCCGCCACC 
ATGGATCACC 
ACGGATTGTG 



TCAAGCGCTT 
CGATCAATCA 
TCACATGTTT 
TGTGATTTAA 
AGTGTAACCA 
TGACTTTTAA 
TAGAATTAAT 
CCTTTTTACA 
AATTGAAAAT 
CTTTCACAAC 
ATTTATAAAT 
TTTAGAAGGT 
ATCAGGCATT 
TATTAGTTCT 
TTTGATAACT 
TTCAGCTTTT 
TTGACCACTC 
CGTATTCAAA 
ACTATTAAAA 
AATTTGCTGA 
AATAAACTTC 
ACCATCAACA 
ATTATGCAAA 
TTCAAGTGAT 
AGTAGTACCA 
TTTCTTCGTT 
CTTTTTCTTA 
ATCGTTTAAA 
TATCTTATTA 



CTTTTTGAGC 
CCGTACTACA 
GAATTGGTCC 
TAAATTCAAG 
CCAAATGTTC 
TAAATTGCTC 
TTAATTGTAT 
ATCATTTTTA 
AATTATCATT 
CTTATTAATG 
ACCCTTTTTC 
AATATTTATC 
AAATAAAATA 
ATT CGTT ATT 
TATTTTCCCT 
GACTGCTCAC 
AATTGATGTT 
TCACCTAATG 
TGTGTAATCG 
CGTTGTTGTO 
AATGCTTGAT 
GTGAATGTAT 
CCATCCATAT 
TTAACAGCCA 
CGGCCAACAA 
TTAGGGTTGA 
CGATCAGCAT 
CTCACTTTTT 
CCAGTAATAA 



ATCTTTCACA 
TGAAGGTTCA 
CATCGACTCG 
TAAATTCGTA 
TTGCATATTA 
ATATCCACCT 
TACTTTATGT 
TTTGAAATAT 
ATTAGTTTTC 
ACAATATTTA 
TGAAAATTAA 
TTTAAATTAA 
GCCCATAAAT 
CTATTTACAG 
TAGTTTACTA 
TAGGAATGAA 
TATTAATCGT 
TTAAATCTGT 
ATGATGGGCT 
- GACCAAAGTC 
CACCATTTAC 
CATTACTTAC 
CGATTGTCGC 
TATTTGGTCC 
TTTCCGCTCT 
TAGATAAAAT 
CTGAATCGAC 
TATCTCTTAA 
AAATTTTAGC 



TCATTGTTCA 
ATTTTACCGT 
TTATAACAAA 
CCTGGTTCTA 
CTCACCCCX3T 
AAAATAACGA. 
ACTAGTTGTT 
TTTGCGCGAA 
CAATTATCTG 
ATAATCACCT 
TAACCCAAGT 
ATTTGTAATG 
ACAAAGTGTT 
AT CATT CT AT 
CTCTAGATTA 
GTAGTACAAT 
GTCATTAGCA 
TTTAACATTA 
TGCAATCTTA 
ACCACCAGCA 
ATGTGTCTGC , 
TACATCAACA 
ATAATGATCA 
ACCATATGCA 
TGTATCACGC 
CAT AAT ACT A 
ACCAAATAAA 
TTCTGAATGA 
AGCTACATAC 



3780 
3840' 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4680 
474 0 
4800 
4860 
4920 
4980 
5040 
5100 
5160. 
5220 
. 5280 
5340 
,5400 
5460 
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GGTAGGCTCA TTTTACTTTT AGACGAACGT TTCAATCCCA CCACTCCTTT ACTATTCCTT 5580 

ACATACTTTG TCTGTTTTCT CTATTTATTA TATAGTAAAA TAATTTTTTT ACTATACTTC 5640 

5 TGTAGACGTA TAACTATTTT TTATCATTTT TTATCTCTAG AGAATATCTA TCTGTATTTT 5700 

TGATAACCAC CATTTGCATT TAAAATTTTA AGTACCGTTT CATGACATGC TTTATTACTT 5760 

ATAATAAAAG GTGCACCCTT TAAATGATCA ATTGCCTTAC CATCTAAAGT CGTCATTTTT 5820 

10 

AGATTCAATA GTTCTGCAAA TAAAAACTGT GCAGCAATGT CCCAAGGTTT AGGATTTGTA 5880 

TTAATATGTG CCCCAAATTG ACCTTTTGCC ACTCGCATAG AATCTAATCC GCAAGCACCA 5940 

ACTAAACGAT AACTAAATGA GGCGTCAAAT AAATCTTGCA CCGTATCTAG ATTCATCACT 6000 

15 

TGTGCATTAA ACGATATAAT AGCGTCTTCC AATTTTAACG ATGGTGGTTC TTC CATCTTA 6060 

ATTCCATTAC AAAAAGCACC TTCTCCTCGT ATTGCTTTAT AAAGCTTTTT ATGCGGATAA 6120 

20 TCATATAGGT AGGATAACAT TGGTTTACCT TCATAAAAAT ACGCCAATAT AATACAATAA 6180 

TCTTC TTG CT GTTTTACTAA ATTGGCAGTT CCATCAATGG GATCCATAAT CCATAAATGA 6240 

TTAATTTCAT TCGTAATCAT TTCATTACTT TTTTCTTCCG CTAATAGTTG GTGTTCCGGA 63 00 

25 AAATGTGTTG CTAAAAATTG TTGGAATTGT TGTTGAATCT GTTTATCTAC ATTTGTAAGT 6360 

AAATCAAATC GATGACGCTT AGTTTCTGTA GTCATTTCCA TAATTAATTG CGGAATAACA 6420 

TTGTCTATTT GTTTCAACCA CGAACATATT AACTTATCTA TTTGCTGTAA TGTTTTATCT 64 80 

30 GTCATTTCGT CCACCACTTC TCATATCATT ATCATTTTAT TATTACCCTA TATTAAAAGA 6540 

ATCAACAATA CAACTGAAGA CTTCTTCATT TTATGCATAA AAAAATCGGC TAGTCACGTG 6600 

CTAGCCGACA AATAGAAAGG AAAGTAAGTA ATAAATATTG AAGATGTTGT GATGTAACTT 6660 

35 

GAACGATTAA AAGCTATCTG TTATATAGCT CTACCCCTTT GTTTAATCGC TCCCCCTGTT 6720 

ACAAGTAATA TCATAGCACA ATCTTTTTTA AAATGT AAGC GTTTTCCACA AAATTTTTAC 6780 

GATTTTTTTA AAAAGATATT GAAAATGTCC TCATTGTCAC TCTTATGTTA TACTTTGTGT 6840 

40 

AATATATCAT CTTTTAGGAG GTGGCTGTCA TGAATAAAGC TGAAAGGCAA AATTTAATAA 6 900 

TTACTGCAAT TCAACAAAAT AAAAAAATGA CCGCTTTAGA ATTAGCTAAA TATTGCAACG 6960 

4S TATCCAAACG CACAATTTTA AGAGATATTG ATGATTTAGA AAATCAAGGT GTTAAAATTT 7020 

ATGCGCATTA TGGGAAAAAT GGTGGTTACC AAATACAACA AGCACAATCT AAAATTGCAT 7080 

TAAACTTATC TGAAACACAA TTATCAGCCT TATTTTTAGT GCTTAATGAA AGTCAGTCGT 7140 

£ 0 ACTCGACATT ACCATATAAA. AGCGAAATCA ACGCAATTAT AAAACAATGT TTAAGTCTTC 72 00 

CACAAACACG CTTAAGAAAA TTGCTTAAAC GCATGGACTT TTATATTAAA TTTGATGACA 7260 
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15 



20 



ATGTGATGTT AGTAGATCAT AGGGTTGATG ATAATATTAA AGCTGAAAAC GTTATATTTA 7380 

TTGGCCTTTT GTGTAAACAT GGACATTGGC ATGCAGTCAT TTATGACATT GCTCAAGACA 7440 
AAACTGCCGA ACTCGAAATT GAAAATATTA TAGATATTTC GTATTCATTC GGTAAGACGA . 7500 

TTCAAACCAG AGACATATCC ATTGATAACT ATCATCAATT TTTAAACCCC ATCGATTCCT 7560 

AAAAAACAGC AGTAAGATGA TTTTCAATTA GAAAATATCT TGCTGCTGTT CTCTATTTAT 7620 

ACAATACTTC GTATTGAATG GnTTCGCTTT CCTAGGGTGC CGTCTCAGCC TTGGTCTTCG 7680 

ACTGGCACTG CTCCCTCAGG AGTCTCGCCA TTAATACTAC GTATTAACAT GTAATTTTAC 774 0 

TTTGAAATAC TTAAAAAAAT AAAACACTTT GCCCAACTTA CACTACCAAT AGAAACTGCT 7800 

GTTAGAATTC CTCAAAATGA TATTTCGCGA TATGTTAATG AAATTGTTAA AAAGATAGCT 7860 

GATAGCGAAT TCGATGAATT CAGACATCAT CGTGGCGCAA CATCCTATCA TCTAAAAATG 7920 

ATGTTAAAAA TCACCTCATA TT CAT AT ACT CAATCTGAAT TTTCTGGCCG TAGAATAGAA 7980 

AAATTACTTC ATAACAGTAT TCGAATGATG TGGTTAGCTC AAGATCAAAC ACCTTCTTAT 8040 

AAAACTATTA ATCTTTTTAG AGTGAATCCT AATACTGATG CGCTAATTGA ATCTTTATTT 8100 

ATTCAGTTTC ATAATAAAAT GCATATCAAA AAAGCTGATT TCTATCAAAT AATTAATAGA 8160 

AATCAGCTTT TTTCaTTGCC TAAAAACTTA ATGTCCCGAC CTCTTTATCT ACGCATAAAT. 8220 

ACTTATTACT GATATAACGA AAGAAACAAA ATTATTTGCT ATATGTAATG CAATTGTTGA 8280 

ACCTAGGTTT CTTCCAGATT TTAAATAAGT. GAAAACTAAT ATGATGGATA GTATGAGATA 8340 

TGGACCAAAC TCAAACGGCG ACTTTGCATC AGTCACATGA ATAAATGCAA ATAAGAACAC 8400 

CGAAACAATA CT CAT AG CT A TAAAATTAAA CTTCTTACCT AATTCTCCAA TTAAAATATG 8460 

35 TCTAAATACG ATTTCTTCAA CTATTGGACC TACAATCACA ATTAATAAGA ATGCTACAGG 8520 

TAAAAATGCA GGCACTTCAA ACATTTTATT TAGCTCAAGT TCATTGGCTG TT t CACTATA 8580 

TTGCAAATGT TTAGGTAGAA ACTGTGTCAT ATATTCATAT GTATAAATTA AGATGAGAGC 8640 

AATAATATAC GTTATTGACA ATCTAAGCCA ATATTTTTTG ATATACGCAA AACCAGCTCG 8700 

. AAGCCTTGAT GGCATCACTT TTAAATGAAA TAAATAAAAT GCGCCAATCC CAATCGTATA 8760 

TGCTAAAGCT TGTGTGATAG TCGCTACAAA TATCAGATTA CTATCGATTT CATAATAACC 882 0 

AAACAAAATT GGTCCTATGT AAGCTGCAAT TGTGAGTGCA TAAAATATAA CACCTATAAT 888 0 

TGGAATTATA AGCAAATCTC TCCATGCTAT ATCTTTAAAC GTGTATTTCT TTTTTTCATT 894 0 

50 TTCCaCTGTT ATATCCtTTC CTGTTTAATA ATTGATTTTT GGAGGTACTT CTACATGATA 9000 

AACGAAACTA AGTATATGAG ACAACAAATT ACTAATTTGA TTCAAATCAT TGATACGATT 9060 



30 



40 



45 
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ATAGTTACTA ATGAATTGAA TAAGTTCAAA GGCTTTGAAA CATCATATAT AATAAACGAA 9180 

AATCAAGTTT CCTATTATGA AATTATAACA CTACTTAATA AACGTCCCCT CgACAAGTCG 9240 

ACTATGGTAA CAAAATTCAA TATCTTAATT TTTATCATAC AGAACTATCT AACGCATTAT 9300 

TTGCAATTAA ATTTGCCCAT TAACCTATTT TTCATAAAAT GTCATTTAAA CAAGTTATTT 9360 

ATTAAAATTC ACTTTATTAC ATAAATTATA CAATTArAAA GTTTCTTCAA ATTGTAAAGA 9420 

TGCATTAATC GAGTTATAAT CATAATGATT AAGATGGT 9458 
(2) INFORMATION FOR SEQ ID NO: 115: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 910 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 115: 

AnGCGTATCA TGTCACGCAT TTTAACTACT TCTTTACCAC AAGATTATAC AGTCACATTA 60 

25 

GTTGATCGTA TGCCATTTCA TGGATTGAAA CCAGAATTTT ATGCTTTAGC TGCGGGCACG 120 

AAATCAGATA AAGATGTTCG TATGAAATTC CCTAATCATC CACAAGTGAA TACAGTTTAT 180 

GGTGAAATTA ACGACATAGA TTTAGATGCT CAAATTGTCT CAGTCGGTAA TTCTAAAATT 240 

30 

GATTATGATG AGCTAATCAT TGGTTTAGGA TGTGAAGATA AATATCATAA CGTTCCAGGA 300 

GCCGAAGAAT ATACACATAG TATTCAAACA CTCTCAAAGG CTCGGGATAC TTTCCATAGT 360 

35 ATTAGTGAAC TACCAGAAGG TGCTAAAGTC GGTATCGTTG GTGCTGGATT AAGCGGCATA 420 

GAACTTGCCA GCGAATTAAG AGAAAGTAGA TCAGACTTGG AAATATATCT TTATGACCGT 4 B0 

GGGCCGCGAA TTTTAAGAAA TTTTCCAGAA AAATTAAGTA AGTATGTTGC GAAATGGTTC 540 

40 GCCAAAAATA ATGTTACCGT TGTTCCAAAT TCAAATATTA ATAAAGTTGA ACCTGGTAAA 600 

ATATATAACT GTGATGAACC TAAAGATATT GATTTAGTTG TATGGACAGC AGGAATTCAA 660 

CCTGTTGAAG TTGTTCGTAA CTTGCCGATT GATATAAATA GTAATGGACG CGTGATAGTT 720 

45 

AACCAGTATC ATCAAGTACC AACATATCGT AACGTCTATG TAGTTGGTGA TTGTGCTGAT 780 

TTACCACATG CGCCAAGTGC TCAGTTAGCC GAAGTTCAAG GTGATCAAAT TGCCGATGTG 84 0 

CTTAAAAAGC AATGGCTAAA TGAACCATTA CCTGACAAAA TGCCGGAACT AAAGGTACAA 900 

so 

GGTATCGTTG 910 
(2> INFORMATION FOR SEQ ID NO: 116: 
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(A) LENGTH: 10182 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 116: 
TTTTTGATTC AAAGTGGTGA TTTAACAAGC ATTTTAAATA GCAATGATTT GAAAGTCACA 
CATGATCCTA CCACTGATTA TTAT AATTTA TCTGGTAAGT TGTCGAACGA TAATCCAAAC ^ 
GTTAAACAAT TAAAACGTAG ATATAATATT CCTAAAAACG CATCAACAAA GGTGGAATTA 
AAGGGAATGA GTGATTTAAA AGGCAATAAT CATCAAGATC AGAAACTTTA TTTTTATTTT 
TCAAGTCCTG GAAAAGACCA AATCATTTAT AAAGAAAGCC TTACTTATAA TAAAATAAGT 
GAACATTAAT ACTTATGCTG TAATTATAGA AACATCCAAA TCATCTATTA ilAATCCTATA 
TTATAAAAnC ACCTCACATA ACTCGTTCAA CTGTACCAAA CCACATTACA TTAGATTTTA 
GGCTAACTAT TGTGATGTAC ATCAAAAACG AATTTGTGAG GCGTTGTATA TTTTACAAAG 
GTGACTAGCG TTTCGTATAG CATTTCCAAC ATTACTACAC TCAAGCGTCA CGCTAAAGTT 
CGAAATCGAA TCCTTTCATT CAACAAAAGC TCATATCCAC TACAAACTTC ATATCAAGCG 
TATAAACTAT CTTGTGATAC TATCTCGATC ATATCTATAG TATGCATTTG TGTTCCGTTT 
CACTGAAGTA TATGTATCAT CAGTTAAGTA TAAACCGTCA TCCTTCAATG TTACTTGATA 
AGCATATTTC CGTGCTAACC AGGCAATATC TATATAATTT TCTCCTGCGT TTTCATAACT 
TCTTAAATCT TCAAT ATGTG CACTAACTTC AGGGaAAATG ATTCTAACAA CACTTTCATC 
AACCCAATAT TTGTCATGCA TCCATCGCAC TTGATCTGCC AATAAAGGTA ACTGCACATC 
ATTGAAATAT AGACGAAAGC CGTCACTATC ATACATTTGC CGATATGGTA ATGGCTGTTT 
TCTAATCACT AACACCTCGC CACCCATTAC GGTGCCTTCT CTAGTATCAT CACTTCCACC 
CGAAGCTTCA TACGTTGTTG GGTCAACCTG TAGTCCATGT ACATCTCCAA TATAAGCATC 
TGGTTTATGT TCCATTGCAT GTCCATGTGC AATCAATGCT AATATTGTAG ATTGTGAAAA 
TTGAGGCTCC CATTCAATGC GATTAGGATG GCTACTATAA ATTCTAGGTT CATCTATAGC 
CTGCTGAATA TCCATGCCAA ACACTAATAC ATTGATTAAT GTTTGCGCAA CACTAGCAAT 
GATACTTATG GCACCAGGTG CACCTACTGT TAATATTGGC TTCCCGTGAT ACATCACAAT 
CGTTGGAGCC ATGTTACTTA GTGGTCGTTT ATATGGTGCA ATTTCGTTAA TACCACCATC 
TACTACATCA AAGCCATCCA TTGTCGTATT CAATAACACA CCGTAGCCTG GAATCGTGAT 
ACCTGAACCA TAAATCATAC CAATTGATGT CGTAAATGAA GCAATATTAC CTTCCTTATC 



659 



EP0 786 519 A2 



10 



is 



ATCAGACACA ACACCATGCT CTATATCAAT ATTTGCTTTA TTGCTATCAA TGAGCGTACT 1620 

GCGTGCTTTT AAATAATCAT CATCAATTAA TGACTGTACA GGCACCTCAT GAAAATTATC 1680 

ATCCGCCAAG TATTGCGCAC GATCACTATA TGCTAAATGC ATCGCTTGTA TCAAATGATG 1740 

CAAGTAATCA ACAGATCTTG GACCCATAGA TGGTAAATCG ACATGTTCTA ATAACTTCAA 1800 

TATTTGAATT ACCGTGATAC CGCCAGAACT AGATGGTCCC ATTGaATAAA TGTCATAGTC 1860 

TTTAAATGTT GCACTGATTG GCGCTTTAAT CTGAATGTCA TATTTGGCTA GATCCTCTAA 1920 

AGTGATTGTC CCACCACATG CTTTGACAAC ATTGACTAAT TGTTTCGCAA TGTCACCTTT 1980 

ATAAAATGCA TTAAACCCTT GTTCTCTTAA TATTTGAAAT GTCTTACCTA ATTCGGGTTG 2040 

TACAATCCAA TCACCTTCAC GCCAATATTG ATTTTCATGC GTAAATACTT GTGCCGTTTC 2100 

ATGATACTTT GTCAATCGTG CGTGTTGCTG GCGCGAATAT TTTTCAGTAG CCCAATTGGC 2160 

20 TGCATGACCT TCAATGGCTA GTTCAATTGC AGGATTAATT AAATCTTCCA ATGACAATTT 2220 

AGCATAACGC TTGTGAATAT AATCAAACAG CTTTGGAATT GCTGGCACAG CGACAGTTTT 2280 

ACCATGTGTA GTCATATCAA AAAATGATTT ATATTCGCCT GAATCATCTA GATAAAATTG 2340 

TTTGTCTACA TGTTCAGGTG CTGTCTCACG TGCATCAAAC GCAGTTATAC TGCCAGTACT 2400 

TTGCTCATAA TATAGCAAAT ACCCGCCACC ACCAATACCT GATGCAAATG GTTCTACCAC 2460 

ATTCAATGCC AGTTGAATTG CAATCACTGC ATCCATGGCG TTGCCACCTT GATCTAATAC 2520 
ATCCTTACCA ATTTTAGCCG CAAGAGGATG TGATACGGAA ATTAACCCTT C1TTAGATGT . 2580 

TTTTGTCTGT TTGTCATTTA AGTTAATGAC CATACTATAT CCTCCTACTT TCTGTTAAAT 2640 

35 ATTTAAAACA TTATTGATTA ATGGCTTTTT CTACTTTTTC TAAATCTTGA CGTTGCTCGT 2700 

TACCAGTATC GACAAGTGGT GTAATCGGTG ATGCAATTTT AAATTTATCG CCACGATAAA 2760 

ACTTAATAAA TTGATCCTGA TCTATCGCAT TAACTACTGC TTGTCTCAAG TTTGGATGCG 2820 

40 TCTTAAATAT ACCTTTTTTA ATATTTAGCA TTAAAAAGAC TGACTTGCGT CCATTTTTGC 2880 

GAATAATGCT TAAATTTTTA TCCGACTTAA TTAAATCAAA ATGTTTTTGA TTCACATCTG 2 940 

CCAACATATC AATTGAATGA TTTCTAAGTT CTGACAATGC ATTATTCGGG TCACCATTAA 3000 

ACTTCAATGT AATATTTTTA ATTTTAGCTG GTCCATAACT ACCTTTTTCT GTTTCGTTGA 3060 

ATCCTGGATT ACGTTGAAAC GTTGCTTGAT ATGCATTTTT CTGTGTCATA ATGTATGCGC 3120 

CACTTGCATA CAGCGCATTT TTCCCATCTG AATTTGCAGG AATTGTACTG CTATCCCCAT 3180 

ATCCTTTTGG ATATTCTTGA TTTACTTGAT TAACAAATTT TTTAGATAAA ATGCCTGCCG 3240 

AAGAGTGTGT TAAGTAATTT ACCTCTCGAG GCATCGATTG ATCTGTCGTA ATTTTAACAA 3300 

55 



25 



30 



45 



SO 



660 



EP 0 786 519 A2 





TATAAGCTTT AATCAACTTA 


TCATAGATTG 


ATTTATCGTC 


CTTGTCTTTC 


TCTTTACGCA 


3420 




ACTGATCGAT GTCCTCATCT 


TTTAATATCT 


TGATGTCATT 


TATATGTTTG 


TGCATATTGT 


3480 


s 


AAGTATTATT GTTAGGCACA 


GACTTTTTAT 


CACGTGCTCT 


ATCTAAAGAA 


AACTTAACAT 


3540 




CTTCAGCCGA TACACGCTCT 


CCAGTATTAC 


GTGCTTGTCC 


ATTGACCACT 


TTCGCAAAAT 


3600 




AATCATCATC TCTTAACAAG 


AAATAAAATG 


CTTTATTGTC 


CTTATTCACA 


GCATAATCAT 


3660 


10 


GACTTAACGA ACCTTTCGTT GTTAAATGAT 


CATTTTCATC 


TAATAATAAT 


AACCTTGTGT 


3720 




ACATATTCAT ATTAATTGAA 


TATACTGACG 


GCGCAATTGA 


ACGTATTGGA 


TCCAATGTAG 


3780 


15 


GAATTTCACC ATCTTGTTGT GTCATCACAA GTGGCCGCGT ATCTCGTTCT 


CTACTATTGT 


3840 


TGTAATCAAA TTGTTGCCAT 


ATTAATGCAC 


GTGAATTTGG 


CAATCCAACA 


CTATTTTTAT 


3900 




CTAACACTTT ATTGTCATAT ACTAAATTCT 


TTTTTGATCC 


ATATAAAGGC 


GCCATATACC 


3960 


20 


CTTTATCAAA TACAACTTCA 


TCTTCAATTT 


GCTTATATGT 


TTGTTTAACA 


TCTGCTTCAT 


4020 




TTTGAiGTAGA AGCTTTATTT 


AACAACTGGT 


CTACATGTTT 


ATCTTTCAAT 


AAACTATTTG 


4060 




ATCCTGTAGA ACTAAATAAT 


GCCGTCATAG 


CATAGTTCGG 


GTCACCAAAC 


ACTGTCATCC 


4140 


25 


AGTCATCAAT TTGGATATCA 


TAATTGCCGG 


CTTGACGTTG 


TGTACGATAG 


CTAC CAT AAT 


4200 




CTGGTTGGAT ATTCATCTTC 


ACGTTAAATC 


CTGCATTTTC 


CAATTGATCT 


TTAACGATAT 


4260 




TCATATCATT TTCATAACTT 


GCTTGTCCTA 


GGAAATGTAT 


TGTTGGTCGC 


TCGCCTTTCA 


4320 


30 


CTTCAACTTT CGATGACTTT 


TGAGCCACTT 


CTGATTTCGT 


AGGGAGACCA CAACCACTTA 


4380 




ATACCAACGC TAAAACTATA 


ATTGCGATAC 


TAATGATTTT 


CTTCACATCT 


ATCCCTACCT 


4440 


35 


TTTTAATGAA TTCTTGGATC 


TAGTGCATCA 


CGCACTGCAT . CACCTATAAA ATTAAATGCT, 


4500 


AAAACGACGA ACATAATACA AACACCAGGT ACAATAGCTA AATTACTGTG CGTTTCCAAG 


. 4560 




TAG1TACTAC CGGTACGTAA AATGTTGCCC CATTCAGCTA CATCAGGTGC 


AACACCAAGT 


4620 


40 


CCTAGGAAAC TTAAACTACT 


TGTTGTTAAT 


ACAACCACAC 


CTATATTTAA 


TGAAAAACGT 


4680 




ACAATCATAG GCGCAATCGC 


ATTCGGTAAA 


ATATAACGCC 


ATATGATATT 


CCAAGTGTTT. 


4740 




TCACCAGTGA TACGTGCTGC 


ATCTACATAT 


TCCATGCGTT 


TAATTTCTAA 


AACACTGGCA 


. 4800 


45 


CGCATTGTCC GTGCAAATGA 


TGGTATATTA 


CCGATACTTA AAGCAATAAT 


TAAATTTGGA 


4860 




ATACTTGCTC CAAATGATGC 


AATAATTGCC 


ACCGCTAACA 


ATAATGATGG 


AATTGCAAAC 


4920 




ACTACATCTA AAATTCGCAT 


TATTAAATTA 


TCAATATGAT 


TAAAATAACC 


TGCGATAGTG 


4930 


50 


CCTAGTAACA CACCAAAAAT 


AACTGCAATA 


ACTACTGAAA 


TAATTGAAAT 


TGAAAATGTC 


5040 




AGCTTCGTTC CTACAACTAC 


GCGTGTAAAT 


AAGTCTCTAC 


CGAAATCATC 


AGTACCAAAC 


5100 
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10 



15 



30 



40 



45 



50 



GTATCAAATG 


TAAATTGTGA 


CACAATTGAT 


AATGTCAGCA 


TGTAGACTAA 


AATAAGTAAC 


5220 


CCGATAATCG 


CAATACGATG 


TCTAGTAGTT 


TTTCGTATAA 


ACGATTCCCA 


CCCGTTATAA 


5260 


CTATGTATTT 


GCGATGTACG 


TTGGTAACGT 


CTAATACTTA 


CAAACATTAA 


TAATGTAAAT 


5340 


ACGTTGCGTG 


TTAATGTCAT 


CAACAATAAC 


AACACTTCGA 


CGATACGTCG 


CCATAGGTCA 


5400 


TGATGCTTCC 


ATGTTTGTTC 


CGTTGTTAAA 


ATAATAATTA 


AAATGATGGT 


TAAAACGATT 


5460 


AGCAATGTTT 


CAGCAATATA 


GAACGTATCG 


GCCACATAAC 


CTTTAAAAAG 


ATTTAATGCA 


5520 


CTCGTTAATA 


TAACTAAAAT 


ATAAGTTGCT 


ATGGCGTAAC 


TTGCGAATAA 


TTTTAAGGAA 


5580 


GCTATCTTTG 


AATTAAGTTG 


TGCCATATGC 


CTCACTTCCT 


TTCGTTGATT 


TCACTACGTA 


5640 


ATTTTGGATC 


GATTAAAGCA 


TAAAATATAT 


CAATAATTAA 


GTTTGCTAAA 


GATATTACAA 


5700 


TTGATATATA 


TACGACCCCA 


CCCATGACTG 


CTGGAATATC 


AGGTATTAGT 


TGTTTTTGGA 


5760 


CGATATAACG 


CCCGATACCA 


TTAATGTTAA 


ATAGTTGTTC 


CGTCACTGCT 


GAACCGCCTA 


5820 


GTAACTCTGC 


CACTAGAAGA 


CCAACTAACG 


TTACAATTGG 


AATAATGGGA 


TTTTTCAAAA 


5880 


TATGTTTAAT 


AACAACTTGT 


GTCGTCGATA 


ATCCTTTTGC 


ATAAGCAGTT 


AAAACATAAT 


5940 


CGctGCGCAT 


TACTTCAAGT 


ACAGAAGACC 


TTGTCATACG 


CGTGATAGAA 


GCAGCAATAC 


6000 


TTGTTCCAAT 


GACAAGTACA 


GGTAAAATCA 


ACGATATTGG 


ATGTTCTGGC 


ATATAAGATG 


6060 


GTGGCAAAAT 


ATCCAATTTC 


AATGAGAACG 


CTAAAATGAA 


TAATAGCCCT 


TGCCAGAAAC 


6120 


TTGGAATAGA 


TAAACCAATT 


AATGCAATTA 


TCATTAACGT 


GATATCAAGC 


CAACTATTTC 


6180 


GCTTCATCGC 


ACTGATAATA 


CCAATTGGTA 


TTGCAATAAT 


TAATGCCACC 


ATTAGCGCTA 


6240 


ATAGTGCGAC 


AATTATTGTA 


ATTGGAATTC 


TTTCGCCAAC 


TGCTTTAGTC 


ACAACCTCAT 


6300 


TCCCTTTGTA 


AGTCGTACCT 


AAGTCAAAGG 


TAAAAACACC 


CTTGATGGTA 


TCCCACAATT 


6360 


GAAXSAAATA 


AGGTTCGTTA 


AGATGATGTA 


ATACATTGAA 


TTGATGTATC 


TGTGCCTTTG 


6420 


TTGClATTTTG 


TCC CAGTATG 


CTATAAGCCG 


CATCAAGCGG 


TGAAAAATAC 


AGAATGGTAA 


6480 


ACACACTGAC 


AATAACACCA 


ATGATGACAA 


TCACAGCCAT 


GACAATTCGT 


TCAAAAATAT 


6540 


ATCTAACTAA 


TGGCTGTAAA 


TAAAAAGTCA 


ATAAGATGAA 


CATCGGCAAG 


GCCAATATCA 


6600 


CTTTGATCAT 


GATGAACTTA 


TGAAATAATA 


CATTTTCAAA 


GTATGTTGAA 


AAATGTGCTT 


6660 


GTTCAATATT 


CTTTGAACTC 


GTATTAGAAC 


TTTGTGCCTT 


GAATATTTTT 


AATGCTTCTT 


6720 


TATGTATTTG 


TGTGGATGAC 


TTTTGCTG CG 


ATAAATATTT 


ATATTTTTGA 


TGTAACGCCT 


6780 


GTTCAATTTC 


TGAAATTTCA 


GAATTATTAG 


CGTAAAAATT 


TTTCCTCTTA 


GCAGAAAAGA 


6840 


AAAACTTTAT 


CACTGCATAT 


AAAAATATTG 


GCAAGCTTAA 


TACCGATAAT 


ACAAACTTGT 


6900 



55 



662 



EP O 786 519 A2 



CTTGTAAAAT AATCTTGAGT AGATTACTAT 

ATTTGTGaAT AGGGAGGCAC AACATCATGT 

5 TACAATTCAA TTATGATGAA ACTACAGTTC 

GAAAAAAACA TATCCTAGGT ATTGTTGGTG 

AATCTA TT TT AGGGCTACTA CCAGATTATC 

10 

TTAATGGGCA ATCGTTAAAT AATTTATCAA 

ATATTTCAAT GATTTTTCAA GATCGACTCT 

AACAAATTAC AGAAGTAATA TTTCAACATA 

15 

TGACAATAGA CATTTTAGAA AAAGTAGGTA 
ATCCACATGA ACTTTCTGGT GGTATGCGTC 

20 TAAAGCCACA AATTTTAATC GCAGATGAaC 

ATCAATTACT GCAGTTAATG AAGTCCCTTT 
- TCACTCACGA TTTAGGCGCT GTGTATCAAT 

26 GAAGTGTCGT TGAAAGTGGC ACGGTTGAAA 

CAAAACGCTT AATAGATGCG ATTCCTGATA 
ACAATGATAT TTTATTAAAA TTCGATCGCG 

30 

CCTATACCGA GCAGTTAATG ATATTAACTT 
TGTCGGTGAA TCAGGGTCAG GGAAATCGAC 
AGTGTCAGAA GGCTTTATTT GGTATAACGA 

35 

ATTGAAATCT TTACGACAAG AGATACAAAT 
TCCAAGATTT AAAGTCATTG ATGTGATTAA 

40 AGATAATGAT GACATTATTA AAACTGTCGT 

AACTTTCTTA TATCGCTATC CACACGAATT 
CGCGAGAGCA CTTGCTGTTG AACCTAAAGT 

45 AGACGTTTCA ATTCAAAAAG ATATCATCGA 

CATCACTTAT TTATTCATCA CACATGACAT 
TGCAGTTATG AAAAATGGCG AAATCGTTGA 

50 

TCCGCAGTCA GACTATGCAA AGCAACTTAT 
GTCATGCGTT GTGCAACTTT ATCACTGTAT 

55 



GATATACAAA AGTATAGAAT AAATTTACAC 


7020 


CAAATTTATT AGAAGTCAAC 


AGTCTGAATG 


7080 


AAGGGGTAAA AAACGTCTCT 


TTCGAATTAC 


7140 


AATCAGGATC 


AGGAAAAAGT 


ATTACCGCTA 


7200 


CAGATCACAC 


ATTAACAGGA 


GAAATTATTT 


7260 


CTTCAGCGTT 


ACAACAAATT 


CGAGGTAAGG 


7320 


CTTCGTTGAA 


TCCAAGATTA 


ACGATTGGCA 


7380 


AACGTGTATC 


TAAATCTGAA 


GCAAAGTCGA 


7440 


TAAAACATGC 


AACTCGACAA 


TTTGATGCTT 


7500 


AACGTGTCAT 


GATAGCAATG 


GCATTGATTT 


7560 


CAACAACGGC 


ATTAGATGCC 


AGTACACAAA 


7620 


ATGAGTACAC 


AGAAACATCT 


ATTATTTTTA 


7680 


TTTGCGACGA 


TGTGATTGT A 


ATGAAAGATG 


7740 


GTATTTTTAA ATCGCCACAA CATACCTATA 


7800 


TTCATCAAAC 


GCGTCCGCCA 


AGACCGTTAA 


7860 


TGAGyGgGAT 


TACACATCAC 


CGAGTGG CAG 


/ 77 & yj 


GGCTATTAGA 


AAAGGCGAAA 


CATTAGGCAT 


7980 


ATTAGCTAAG 


ACGGTCGTCG 


GTCTAAAGGA 


8040 


ATTAC CATTA 


AGTTTATTTA 


AAGATGATGA 


8100 


GATTTTTCAA 


GATCCATTCG 


CATCTATTAA 


8160 


ACGACCACTA 


ATCATTCATG 


GGAAAGTCAA 


8220 


ATCGTTGTTA 


GAAAAGGTTG 


GCCTAGATCA 


8280 


ATCTGGTGGG 


CAACGTCAGC 


GTGTAAGTAT 


8340 


GATTGTTTGC 


GACGAGGCAG 


TGTCCGCTTT 


8400 


GTTATTAAAA 


CAATTACAGT 


TAGACTTCGG 


8460 


GGGTGTTATC 


AATGAAATAT 


GTGATCGCGT 


8520 


ACTGAATAAC 


ACAGAAGATA 


TTATCAAACA 


8580 


TTCAGAAGTA 


GCAGTTATTG 


CTAAATAAAA 


8640 


GGTCTGAAAT 


AAATTGCGCG 


ACTTCTGATG 


8700 
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5 



10 



15 



20 



25 



30 



35 



40 



TATCAAGTTT 


TAGGTGCTTT 


GCCATGATTT 


AAGAGTCACC 


CCCATACTTT 


GGGCATTTTA 


8820 


ACGCCAGAAT 


AAATCCCCCG 


CCACTATGTG 


AAGTGTGGGG 


GATTATTTAT ATTTTATTAG 


8880 


AATATTCAGA 


TTTTTGAGTG 


TGTCAACTTA 


GCTTAGTCAA 


TGTATATTTA ACGTCACTTA 


8940 


CTCTTTTTCT 


TTCATAATTA 


ACACATTCAA 


ATAAACTTTG 


ATCAAAAAAC 


ACAAAGTTAA 


9000 


AAGTACCATC 


TTGTAATATG 


CT CT CAT ACA 


TTATCCCGTC 


ATATTTAAGG 


CTTCGAATAT 


9060 


AATCAG CTAA 


ATATTGAAAT 


GG CAAATAAT 


CTATTCCTTG 


TTCATCGCTT GGATTTGTTA 


9120 


TTfTTTTATG 

X X.V-W-X A A>«"V.aw 


aatctttitt 


AATGTTTGGT 


AATTTACAAA ATACTTTCTA AATC CAT CAT 


9180 




GATTG CATTA 


CTAGTTAAAT 


TAGTTAAATT 


CGCAATTTTC AATTTCTCTT 


9240 


TfYlT A Of^lT 


T**r*lT*TY5TAAC 


TTAAC CTT AC 


CTATATAAAT 


AATGTCATTA 


TGCTTAGGTT 


9300 


ft, ^* , J I, 1Y ,, *I" IV* 


TATACTGACC 


x \J x x v» A * A a 


TACTAAGGTA 


TAATACGCTT ATCCATTTAG 


9360 








TTGGTGGTGA 


CATTAGTTCA 


CTTTTCTCTG 


9420 


XAnXVMviVX X 


AnLini 1 ^— x./"\ 


GATCTTATATA 


ATGGTTCAAA 


TCTTTCTCTA AATTCCTCAA 


9480 


lALlAlAbin 


A X xnut X n\j X V7 


ATATCGAGAA 


AGAACGCTAA 


ATTCTCTAAA 


TTGATCATAT 


9540 


TTTTATGAAA 


ILinl XXX in 


TACTTCAAGC 


TCTCACAAAA 


TCCATCCCAG 


TCATTATTTG 


9600 


L. 1 nLnn 1 iiiu 


>i X XXX XrtX x x 


GTATATTTTT 


TATCGTTTAT 


GATTTTAGCG 


CCTACTAAAT 


9660 




X <-.vjr x \^ i-n 1*- i 


AAATTTTCAT 


CATCTTTAAA 


AAGTT CATTT 


AAAATACAAC 


9720 


linll XVJrtVJW 


X X v_v_ x 


TTAAATATAC 


TCCAGTCGTC 


TTTTAATGCT 


ATTTCAATCT 


9780 


XXX XA<w^ xx.*»- 


TTTTGGG CTA 


AAAGTATCTG 


GTAAATTTAT 


ACTAATATCA 


TATAATTCTA 


9840 


ATGCTGGTCT 

X\ X VJ v> X V7V7 1S»1 


TAAATAATCT 


CTAAT AAGTT 


CTAATTTATC 


TATGTCCTTA 


GTCGTATCAA 


9900 


ATATTTTAAC 


ACCAAGATGA 


TTGTTATCAA 


TATCAGAATT 


GTCAAATTTG 


CTATTTATCA 


9960 


TTTGCAATGA 


TTTCTACGAT 


TTCAGTATTA 


TTAAAACATT 


TTTCACATAT 


TTTCATTTTG 


10020 


AGACfCCAAG 


TATCTATTCA 


TAATTTCTAG 


GTGATGCATG ATAGATAACC 


TTTTAATTAA 


10080 


ACCTAATGCT 


GGATa CTTAT 


TATTTTCATT 


TAATTCTTCA 


AATTGTCCCA 


AGCGCATAAG 


10140 


ATCTATTTTT 


AATATCTAAG 


TTTTTTGACC 


ATGTTACTAA 


TT ■ 




10182 



45 

(2) INFORMATION FOR SEQ ID NO: 117: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3491 base pairs 

(B) TYPE: nucleic acid 
50 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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AACTCAGGCA ATTGAAACAG CATTAGGTGC TTCATTACAA CATGTCATTG TAGATTCAGA 60 

AAAAGATGGA CGCCAGGCTA TTCAATTTTT AAAAGAACGT AATTTAGGTC GTGCGACGTT. 120 

TTTACCATTA AATGTTATAC AGAGTAGAGT GGTAGCGACT GATATTAAAT CTATTGCTAA 180 

AGAGGCAAAC GGATTTATTA GTATCGCTTC GGAAGCAGTT AAAGTAGCAC CAGAATATCA 240 

AAATATTATC GGG AATTT AT TAGGTAATAC GATTATCGTT GATCATTTAA AGCATGCAAA 300 

TGAATTGGCA CGTGCGATTA AATATCGAAC TCGTATTGTT AGTTTGGAAG GTGATATTGT 360 

AAATCCTGGT GGtTCTATGA CTGGTGGTGG CGCTCGTAAG TCAAAAAGTA TTCTGTCTCA 420 

AAAAGACGAG TTGACAACAA TGAGACACCA ATTAGAAGAT TACTTGCGTC AAACAGAATC 480 

ATTTGAACAA CAATTTAAAG AGTTGAAGAT AAAAAGTGAT CAATTAAGTG AACTGTATTT 540 

TGAAAAAAGT CAAAAGCATA ATACACTTAA AGAGCAAGTG CATCATTTTG AAATGGAGCT 600 

CGATAGATTA ACTACACAAG AAACACAAAT AAAAAATGAT CATGaAGAAT TCGAATTTGA 660 

AAAAAATGAT GGTTATACGA GTGACAAAAG TCGACAAACT TTGAGTGAAA AAG AAACTTA 720 

TCTAGAAAGT ATTAAAGCAT CTTTAAAACG ACTAGAAGAT GAAATTGAAC GCTACACAAA 780 

ACTTTCTAAA GAAGGTAAGG AAAGCGTTAC TAAAACACAA CAAACCTTAC ATCAGAAACA 840 

ATCTGATCTT GCTGTGGTTA AAGAGCGTAT TAAAACACAA CAACAGACAA TAGATCGATT 900 

AAATAATCAA AATCAACAAA CTAAACATCA ATTAAAAGAT GTTAAAGAAA AAATTGCATT 960 

CTTTAATTCG GATGAAGTGA TGGGCGAACA AGCTTTTCAA AATATTAAAG ATCAAATTAA 1020 

TGGTCAACAA GAAACGAGAA CACGCTTATC AGATGAATTA GATAAATTGA AACAACAACG 1080 

TATTGAGTTG AATGAACAAA TCGATGCGCA AGAAGCTAAA CTACAAGTTT GTCACCAAGA 1140 

TATTTTAGCT ATCGAAAATC AGTACCAAGA TATTAAAGCT , GAACAATCAA AGCTAGATGT 1200 

ATTMTTCAT CATGCGATAG ATCATTaAAT. GATGrATATC AATTGACTGT TGAACGTGCG 1260 

ArATCTGAAT ATACGaGTGA TGrATCGATg ACGCATTACG TAAAAAAGTT AAGTTAATG r 132 0 

AGaTGyCGAT TGATG r ACT A GGTCCTGTAA ACTTAAATGC AATTGAACAA- TTTGAAGAGT, 1380 

TAAATGAAGG TTATACATTT TTAAGTGAAC AACX3TACAGA TCTTCGTAAA GGTAAAGAAA 1440 

GATTAGAGCA AATTATAAGT GAAATGGATC AAGAGGTTAC TGAAAGATTT AAAGAAACTT 1500 

TCCATGCTAT TCAAGGACAT TTTACAGCTG TGTTCAAACA ATTGTTTGGT GGAGGCGATG 1560 

CAGAATTGCA ATTAACTGAA GCCGATTATT TAACAGCTGG TATTGATATT GTGGtACAAC 1620 

CACCGGGTAA AAAGTTGCAA CATTTATCGT TACTGAGTGG TGGTGAGCGT GCATTAACTG 1680 

CTATTGCTTT ACTATTTGCA ATTTTAAAAG TAAGAT CTGC ACCTTTTGTT ATATTAGrTG 1740 
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TATCAGACGA 


AACACAATTC 


ATTGTTATTA 


CACACCGTAA 


AGGAACAATG 


GAATTTGCAG 


1860 




ATAGGTTATA 


CGGTGTAACA 


ATGCAAGAAT 


CAGGTGTTAC 


TAAACTTGTG 


AGTGTGAATT 


1920 


5 


TAAATACAAT 


AGATGATGTG 


TTGAAGGAGG 


AGCAATAATG 


AG CTTTTTTA 


AACG CTTAAA 


1980 




AGATAAGTTT 


GCAACAAATA 


AAGAAAATGA 


AGAAGTTAAA 


TCCTTAACAG 


AAGAACAAGG 


2040 


10 


TCAAGACAAA 


TTAGAAGATA 


CACATTCTGA 


AGGTTCAACG 


CAGGACGCAA 


ATGATTTAGC 


2100 


AGAAAATGCT 


GAAGTGAAAA 


AGAAGCCACG 


CAAGTTGAGT 


GAAGCGGATT 


TTGATGACGA 


2160 




TGGCTTAATA 


TCAATTGAAG 


ATTTTGAAGA 


AATTGAAGCT 


CAAAAAATGG 


GTGCTAAATT 


2220 


15 


TAAAGCAGQA 


CTCGAAAAAT 


CTCGTCAAAA 


TTTCCAAGAA 


CAATTAAATA 


ATTTGATAGC 


2280 




GAGATATCGT 


AAAGTAGATG 


AAGACTTTTT 


TGAAGCTTTA 


GAAG AAATGT 


TAATCACTGC 


2340 




AGACGTCGGT 


TTTAATACAG 


TGATGACGTT 


AACTGAAGAA 


TTACGTATGG 


AAGCACAACG 


2400 


20 


ACGTAATATT 


CAAGATACTG 


AAGATTTGCG 


TGAAGTCATT 


GTTGAAAAGA 


TCGTAGAGAT 


2460 




TTACCATCAA 


GAAGATkATA 


ATTCAGAAGC 


TATGAACTTA 


GAAGATGGTC 


GTTTAAATGT 


2520 




CATTTTAATG 


GTTGGTGTGA 


ATGGTGTTGG 


TAAAACAACA 


ACAATTGGAA 


AATTAGCTTA 


2580 


25 


CCGATATAAA 


ATGGAAGGTA 


AAAAAGTAAT 


GTTAGCTGCG 


GGCGATACTT 


TTAGAGCGGG 


2640 




TGCTATTGAT 


GAATTGAAAG 


TTTGGGGCGA 


ACGTGTTGGT 


GTAGACGTAA 


TTAGCCAAAG 


2700 


30 


TGAAGGTTCT 


GATCCAGCTG 


CTGTTATGTA TGATGCg ATT AATGCCG CTA 


AAAACAAAGG 


2760 


TGTTGATATT 


TTAATCTGTG 


ATACCGCTGG 


ACGTTTACAA 


AATAAmACAA 


ATCTAATGCm * 


2820 




AGAATTAGAA 


AAAGTTAAGC 


GTGTAATTAA 


TCGAGGAGTG 


CCAGATGCGC 


CTCATGAAGC 


2880 


35 


- * ATTACTATGT 


TTAGATGCTA 


CAACTGGTCA 


GAATGGGTTG 


TCACAAGCTA 


GAAACTTTAA 


2940 




• AGAAGTAACA 


AATGTTACAG 


GTATTGTATT 


AACGAAATTA 


GATGGTACAG 


CCAAAGGTGG 


3000 




TATGGTATTA 


GCCATTCGTA 


ATGAATTGCA 


CATCCGAGTT 


AAATATGTAG 


GTTTAGGTGA 


3060 


40 


GCAATTAGAT 


GACTTACAAC 


CATTTAACCC 


TGAAAGTTAT 


GTCTACGGCT 


TATTCGCTGA 


3120 




TATGATTGAA 


CAAAATGAAG 


AAATAACAAC 


AGTTGAAAAT 


GATCAAATTG 


TAACAGAAGA 


3180 




AAAGGACGAT 


AATCATGGGT 


CAAAATGATT 


TAGTtAAAAC 


GTTACGAATG 


AATTATTTGT 


3240 


45 




raa.Tr nr&T 

X \— l_ X A. r\ X 


TGACGAATAA 


ACAACGTaAT 


TATTTGGAAT 


TATTTTATCT 


3300 




TGAAGATTAT 


TCTTTAAGTG 


AAATCGCAGa 


TACTTTTAAT 


GTGAGTAGaC 


AAGCAGTTTA 


3360 


50 


TGATAATATA 


AGAAGAACTG 


GCGATTTAGT 


TGAAGATTAT 


GAAAAGAAAT 


TGGAATTATA 


3420 


CCAGAAATTT 
AGAACAAATA 


GAGCAACGCC 
C 


GAGAAATATA 


TGATGAAATG 


AAACCACATT 


TAAGTAATCC 


3480 
3491 



55 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4253 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 118: 
AGTACGTTTT ATAATTATAA GTACGTAATT AACATATTAA CATATCGCAA GTATGTATTT 
AAATAAgATT GTTATAATTT CAAAGTTCAT CCAAGaTTAT GGCGTTTGCA TTTACCTATT 
AAAAACGTTA TTATATCAAA GATGCGAAAG ATAATACGGG TTTATTTTAT GAAAGTGAGA 
AGGATAAAAT GGATAATGAG CAACGCTTAA AAAGAAGAGA GAATATAAGG AATTTCTCGA 
TTATAGCACA TATTGACCAC GGAAAATCTA CATTGGCTGA TAGAATTTTA GAAAATACCA 
AATCAGTTGA AACAAGAGAT ATGCAAGATC AGTTACTAGA TTCAATGGAT TTAGAAAGAG 
AACGTGGTAT TACAATCAAA TTAAACGCgT ACGTTTAAAG TACGAAGCTA AAGATGGAAA 
TACTTATACA TTCCATTTAA TCGATACGCC TGGACACGTC GATTTTACAT, ATGAAGTGTC 
ACGTTcTTTG GCAGCTTGTG AGGGCGCGAT TTTAGTAGTA GATGCGGCTC AAGGTATCGA 
AGCACAAACA TTAGCAAATG TTTATTTAGC ATTAGATAAT GAGTTAGAGT TATTGCCTGT 
TATTAACAAA ATTGATTT AC CTGCTGCAGA ACCTGAACGC GTGAAACAAG AAATTGAAGA 
TATGATAGGT TTAGACCAAG ACGATGTTGT TTTAGCAAGT GCTAAATCTA' ACATTGGAAT 
TGAAGAGATA CTAGAGAAAA TAGTTGAAGT TGTGCCAGCT CCAGATGGTG ACCCAGAAGC 
ACCACTAAAA GCGTTAATAT TTGATTCTGA* GTATGATCCA TATAGAGGGG TAATTTCATC 
GATAAGAATT GTGGACGGTG TTGTTAAAGC CGGAGATAAA ATTCGAATGA TGGCCACTGG 
TAAABAGTTC GAAGTAACAG AAGTTGGAAT TAATACACCT AAGCAGCTTC CAGTTGATGA 
ATTAACAGTT GGTGATGTTG GTTATATTAT , TGCAAGTATT AAAAATGTTG ATGATTCTAG 
GGTTGGTGAC AC CAT CACAT TAGCTAGTAG ACCTGCATCA GAACCATTGC AAGGTTATAA 
GAAAATGAAT CCAATGGTAT ATTGCGGACT GTTCCCAATA GATAACAAAA ATTATAATGA 
TTTAAGAGAA GCATTAGAAA AATTACAATT GAATGATGCA TCATTAGAAT TTGAGCCTGA 
ATCGTCACAA GCATTAGGTT TTGGTTATAG AACTGGTTTC TTAGGTATGT TACACATGGA 
AATAATTCAA GAAAGAATTG AAAGAGAATT TGGTATTGAA TTAATTGCAA CTGCACCATC 
TGTAATTTAT CAATGTGTTT TAAGGGACGG TTCAGAAGTG ACGGTTGATA ACCCAGCACA 
AATGCCAGAT CGTGATAAAA TTGATAAAAT ATTTGAGCCA TATGTTCGTG CAaCTATGAT 
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TATAAATATG GACTATTTAG ATGATATTCG TGTAAATATT GTTTATGAAT TACCTTTAGC 1560 

TGAAGTTGTA TTTGATTTCT TCGATCAACT TAAATCTAAT ACTAAAGGAT ATGCATCATT 1620 

5 

TGATTATGAA TTCATCGAAA ATAAAGAAAG TAATTTAGTC AAGATGGATA TTTTATTAAA 1680 

TGGTGATAAA GTGGATGCGC TAAGCTTCAT AGTTCATAGA GATTTTGCAT ATGAACGTGG 1740 

TAAAGCATTA GTTGAAAAAC TTAAAACGTT AATTCCAAGA CAGCAATTTG AAGTACCTGT 1800 

10 

ACAGGCTGCA ATAGGACAAA AAATTGTAGC GCGTACAAAT ATTAAATCAA TGGGTAAAAA . 1860 

CGTTTTAGCT AAATGTTATG GCGGTGACAT AAGCCGTAAA CGTAAATTAC TTGAAAAACA 1920 

75 AAAAGCAGGT AAAGCTAAGA TGAAAGCAGT TGGTAATGTT GAAATTCCAC AAGATG CTTT 1980 

CTTGGCTGTA TTGAAAATGG ATGATGAATA ATTTTAAAAA ATCAATTAAC AATTTACAAT 204 0 

GAATAAAGTT TAATAACTAA AAAGAGGGAG CCTAGGATAA ATTAACGTCC TGGGCTTTAC 2100 

20 AATGTTATAT TGGCAGCCAT CGACAGAGTT AAAATGAGCT TATAACAATG GGGCCCCAAC 2160 

ACAGAAGCTG ACGAAAAGTC AGCTTACTAT AATGTGCAAG TTGGGGTGGG GCCCCAACAT 2220 

AGAGAATTTC GAAAAGAAAT TCTACAGGCA ATGCAAGTTG GGGTGGGACG ACGAAATAAA 2280 

25 

TTTTGCGAAA ATATCATTTC TGTCCCACTC CCTTATGCAT GAGTTTTACT CATGTAATTT 2340 

TATTTTTAAG GACATATTAC ATCTGGCTAA TGTGTAAGAG CCACTACATA ATAAATCATT 24 00 

AGTGGTTCTT TATTATTTCT ATCTCACTCC CTCTAAACAA GAATAAATAT TAAAATGAAT 24 60 

30 

CGATATATTA GACAATCATT GATTAAACGT TAAAGTTAAA AGTAAGAATA ATTGCAGATA 2520 

GTCCAACAGG ATATAG CCG A TTGG ATAAAA AGTCTGAGAA GCGGGGCATT AAAATGACGG 2580 

35 TACAAAGTGC ATATATACAT ATTCCATTTT GTGTAAGAAT ATGTACATAT TGTGATTTCA 2640 

ATAAATATTT TATACAGAAT CAACCTGTAG ATGAGTACTT AGATGGACTA ATCACAGAAA 2700 

TGTCTACAGC AAAATATAGG ATCTTAAAGA CCATGTATGT AGGTGGCGGC ACACCAACGG 2760 

40 CCCTTTCTAT TAAT CaGTTG GAAAGATTAC TTAAAGCAAT ACGTGATACG TTTACAATCA 2820 

CAGGCGAGTA TACATTTGAA GCAAATCCTG ATGAGTTAAC TAAAGAGAAA GTCCAACTAT 2880 

TAGAGAAATA TGGAGTAAAA AGGATTTCAA TGGGCGTTCA AACATTCAAG C CGGAGTT AT 2940 

45 

TGTCTGTTTT AGGTAGAACG CACAATACTG AAGATATTTA CACTTCGGTG TTAAATG CTA 3000 

AAAACGCAGG TATTAAATCA ATCAGTTTAG ATTTAATGTA TCATTTACCG AAACAGACGA 3060 

TTGAAGATTT TGAACAAAGT TTAGATCTAG CTTTAGATAT GGATATTCAA GATATTTCGA 3120 

SO 

GTTACGGCTT AATACTTGAA CCTAAAACCC AATTTTATAA TATGTATAGA AAAGGCTTGC 3180- 

TCAAACTTGC TAATGAGGAT TTAGGTGCTG ACATGTATCA GTTGCTGATG TCTAAGATAG 3240 

SS 
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AACATAATAA GGTTTACTGG TTTAATGAGG AATATTATGG ATTTGGAGCA GGTGCAAGTG, 
GTTATGTAGA TGGTGTGCGT TATACGAATA TCAATCCAGT GAATCATTAT ATCAAAGCTA 
TAAATAAAGA AAGTAAAGCA ATTTTAGTAT CAAATAAACC TTCTTTGACT GAGAGAATGG 
AAGAAGAAAT GTTTCTTGGG TTGCGTTTAA ATGAAGGTGT GAGTAGTAGT AGGTTCAAAA 
AGAAGTTTGA CCAATCTATT GAAAGTGTCT TTGGTCAAAC AATAAATAAT TTAAAAGAGA 
AGGAATTAAT TGTAGAAAAG AACGATGTGA TTGCACTTAC AAATAGAGGG AAAGTCATAG 
GTAATGAGGT TTTTGAAGCT TTCCTAATAA ATGATTAAAA AAAATTGAAA TTTCGAGTCT 
TTAACATTGA CTTACTTTGA CCAATTTGAT AAATTATAAT TAGCACTTGA GATAAGTGAG 
TGCTAATGAG GTGAAAACAT GATTACAGAT AGGCAATTGA GTATATTAAA CGCAATTGTT 
GAGGATTATG TTGATTTTGG ACAACCCX3TT GGTTCTAAAA CACTAATTGA GCGACATAAC 
TTGAATGTTA GTCCTGCTAC AATTAGAAAT GAGATGAAAC AGCTTGAAGA TTTAAACTAT 
ATCGAGAAGA CACATAGTTC TTCAGGGCGT TCGCCATCAC AATTAGGTTT TAGGTATTAT 
GTCAATCGTT TACTTGAACA AACATCTCAT CAAAAAACAA ATAAATTAAG ACGATTAAAT 
CAATTGTTAG TTGAGAATCA ATATGATGTA TCATCAGCAT TGACATATTT TGCAGATGAA 
TTATCAAATA TATCTCAATA TACAACTTTA GTTGTTCATC CTAATCATAA ACAAGATATT 
ATCAATAATG TACACTTGAT TCGTGCTAAT CCTAATTTAG TTATAATGGT TAT 
(2) INFORMATION FOR SEQ ID NO: 119: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3395 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

M-xi) SEQUENCE DESCRIPTION: SEQ ID NO: 119: 
TCCCTAATCG AACAAAATTA TGCGCATAAA CAAAGTAGAT TGATATAAAA TTCTTAATTA 
TCAGAATATA TTTACAAATC TGAATTTTAT TAGTATATTG GrTAGTrTTC ATAGAGGCAT 
GACGGTaTTT GAGCAGGATT TTAAATCGGg ATTTTATAAT CGATTTAAGA GAGGCCACtT 
TGCTTGcACA TTAATACTGT CAATGGGAGG GGAATGTATA TGAGTrAAGC ACATCAATTA - 
ATTCAAGAGG ATGAACATTA TTTTGCGAAA TCAGGACGTA TTAAATATTA TCCGTTAGTG 
ATTGATCATG GATATGGAGC AACATTGGTT GATATTGAGG GGAAGACATA TATCGATTTG 
TTATCGAGTG CGAGTTCTCA AAACGTAGGT CATGCACCTA GAGAAGTAAC AGAAGCGATA 
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GTACGTTTAG CTAAGAAGCT TTGTGAGATT GCACCTGGAG ATTTTGAAAA AAGAGTGACC 540 

TTCGGATTAA CCGGATCAGA CGCAAATGAT GGCATCATTA AATTTGCCAG AGCATATACA 600 

5 

GGGCGTCCTT ATATCATTAG TTTCACTAAT GCATATCATG GTTCAACTTT TGGCTCATTG 660 

TCTATGTCAG CTATTAGTTT AAATATG CGC AAACATTATG GTCCGTTATT GAATGGTTTT 720 

TATCATATTC CGTTTCCAGA TAAATATCGT GGTATGTACG AGCAGCCACA AGCTAATTCA 780 

10 

GTAGAAGAAT ATTTAGCACC CTTAAAAGAA ATGTTTG CGA AGTATGTACC TGCTGACGAA 84 0 

GTAGCATGTA TTGTTATTGA AACGATACAA GGCGATGGTG GACTTTTAGA ACCAGTTCCA 900 

1S GGGTATTTTG AAGCGTTAGA AAAGATTTGT CGTGAAGATG GTATTTTAAT CGCTGTCGAT 960 

GATATTCAAC AAGGTTTTGG GAGAACAGGT ACATGGAGTT CAGTCTCGCA TTTTAATTTT 1020 

ACGCCTGATT TAATCACTTT CGGAAAATCC TTAGCAGGTG GTATGCCTAT GTCAGCAATT 1080 

20 GTTGGACGCA AAGAGATTAT GAATTGTTTA GAAGCACCAG CACATTTATT TACAACAGGT 1140 

GCTAATCCAG TTAGTTGTGA AGCTGCATTA GCCACAATTC AAATGATTGA AGATCAGTCG 1200 

CTTCTTCAGG CTAGTGCGGA AAAAGGGGAA TATGTTAGGA AACGAATGGA TCAATGGGTA 1260 

TCTAAATACA ATAGTGTAGG CGATGTTAGA GGTAAAGGTC TGAGCATTGG TATTGATATT 1320 

GTTTC CGACA AAAAACTCAA AACACGTGAT GCCAGTGCGG CACTTAAAAT TTGTAATTAC 13 80 

- TGCTTTGAGC ATGGCGTAGT TATTATAGCT GTAGCAGGAA ATGTGTTGCG ATTCCAACCG 144 0 

CCATTGGTAA TAACATATGA GCAATTAGAC ACGGCGTTAA ACACTATAGA AGATGCACTG 1500 

ACTGCTTTGG AAGCAGGTAA CTTAGATCAA TATGACATAT CTGGACAAGG TTGGTAATAG 1560 

CGATTATCTT AATATAAAAT AAAAAATCAT TTCCACATCT GGATGTTAAT CAGATGGGAA 1620 

ATGATTTTTT TTATTTTTTA TTTTGGTGGG TGGTATTCAG CTACGTCATT TTTCTTAGAA 1680 

TGTCTAAGTC CATAACTTAA ATATAGGATG ATACCAACAA TAAACCAAAT TAAAGTGTAT 174 0 

40 AATTTCGCTT CGAATCCTAA TCCCCAGAAT ACTAGCAATA CTAAAACAAA TGTAATTGCT 1800 

GGTAACACAG GATATAAAGG TAATTTAAAT GCAGGAATTG GTAGATCTTT ACCTTcACGC 1860 

TTTCTCAAAC GATACATTGC TAATGAAACG AACATAAATG CAACAAGTGT ACCTGCTGAA 1920 

ATTAATTGTG CTAAAAATGC GAATGGGAAC ATAGAACCAA TTAAAACACC AATAATAGTA 1980 

AGTATAACTA GTGCGCGATT AGGTAAATGT TTGTCGTTTA AGTGGCTTAA CCATGAAGGT 204 0 

AATAAGCCGT CACGTCCAAA TGAATAAAGT AAACGTGAGC CTGCTAACAT CATACCAATT 2100 

AATGCTGTAA ACATACCGAT AACAGAGATA GCTTGAACAA TAGCTGCTAC AACACCATGA 2160 

CCACTTTGAC GTAAAGCCCA ACCAACAGGT TCAGCATTGT TTG CGTATTG TGAGTAATGG 2220 
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5 



10 



15 



20 



25 



30 



CCAAGAATAC 


CTCTAGGCAT 


TGTCTTTTGA 




V<ilvXwvlv" VJ X X X w# x \*v»v» 


2340 


ATAGAATCGA 


AACCGATATA 


CGCTAAGAAA 




v^^V^VvAwV^nxn iniww -i. j.ww 


2400 


CATCCACCAA 


AGTCACCTGT 


AGCAGTTACT 


I Ibiol lulu 


n a »TA & ATfrn cacatagtta 


2460 


CTAACATTTA 


TTG CTGTTAA 


ACCTACGATu 


ALAnAliVnnA 


T2VATAGCTAA TACTTTTAAA 


2520 


ATAACTAAAA 


TATTTTCCAT 


ACGAGCTGCT 


TCCGACAIAt, 




2580 


GTTAATAAAA 


TAACGATAGC 


AGCAATAATA 


*^^^n ^a a a a f 
TCGATAAAAC 


V~VJV»V_A1 1 X Vjr X .r»V,V— J. u\*r*. 


2640 


TTTGATAATG 


CTGCAGGTAA 


TTCGATGCCA 


ATTGGTTTCA 


rriRrTprrrn *pa A 2VTT CGfTP 

LnnulCwLu iMrtrti xv-vjv—x 


2700 


GAGAATCCTG 


ATGCAACAAA 


GGCTACGGCG 


ATAAAATATT 


CAGCTAATAG AGCCCAACCG 


2760 


GCAACCCATC 


CAAAAAATTC 


ACCAAATAAT 


ACATTGACCC 


AAGAATAGGC TGAACCTGCA 




AATGGCATAG 


CGGCAGCCAT 


TTCTGCATAA 


GTAAATGCAA 


CTAAACCAGC AACAATAGCA 


*OOV 


GGGAGTAAGA 


ATGATAACGC 


AACGGCCGGT 


CCTGCATGTT 


CTGCAGCAAC AATGCCAGGT 


O OA ft 


AGCGTAAAGA 


TAGATGTCGA 


TACAATTGTT 


CCTACACCTA AAGCTAAGAA ATCACGCACC 


•a n nn 
JUUU 


CGAAGTGTAC 


GCTTTAAATG 


ACCATCTTTA 


TTTTGATAGA 


TAGCCGGATC CTCTTTTCGT 




GCTATTTTAT 


TGAAAAAACT 


TCCCATAAAC 


TTTCCTCCCA AACATTCATA AACAATTCTA 




TACGGTGTTT 


TTTAATATGT 


TATATCATAG 


CACAAATAAT 


CAATATTTTG TCTAAAAATT 


3180 


CTGAAAAATC 


ACAACTTTAT 


GTTACGTATT 


AATGACTTGT 


CTTGATAACA TC CAT AG ATT 


3240 


TTTTAAATGA 


TAAAACTGAT 


TATAACAGAT 


ATTAAATGAA 


TAAGTACTAT TTTTTGCnAA 


3300 


TTTTCTAACA 


ATTTTG CACA 


TTATATGTTT 


AAAATCAATT 


TCATGTTTAT GGTGTGATTG 


3360 


GCTAGTGTGT 


ATGAAATGTA 


AnTCTTTGAC 


TlinGA 




33 95 



35 

(2) INFORMATION FOR SEQ ID NO: 120: 

- (i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 13508 base pairs 
40 ' (B) TYPE: nucleic acid 

CO STRANDEDNESS: double 
(D) TOPOLOGY: linear 

45 ( X i) SEQUENCE DESCRIPTION: SEQ ID NO: 120: 

ATCAGGTAAT GCCATGCGTT TAGCTGAAAA TTTTTTCAGA ACGTTTAAGT GATATCGGAC 60 

ATCAAGTTGT TTTGATGTCA ATGGATGAAT ATGATACGAC AAACATCGCG CAGTTAGAAG 120 

50 ATTTATTTAT TATTACGTCT ACTCATGGTG AAGGAGAACC GCCTGATAAT GCATGGGATT 180 

TCTTTGAATT TTTAGAAGAC GATAACGCAC CTAATTTAAA TCATGTGAGA TATTCAGTAC 240 

55 
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TACTAGAAAA 


TCTAGGCGCT 


GAGCGTATAT 


GTAAGCGTGT 


AGATTGTGAT 


ATTGATTATG 






AAGAAGACGC 


AGAAAAGTGG 


ATGGCAGACA 


T CATTAAT AT 


TATTGATACC 


ACATCAGAAG 


420 


5 


GTATTCAAAG 


TGAATCGGTG 


ATAAGTGAAT 


CAATTAAGTC 


TGCCAAAGAA 


AAGAAATATT 


480 




CTAAATCAAA 


TCCATACCAA 


GCAGAAGTAT 


TAGCGAATAT 


CAATTTAAAT 


GGTACCGATT 


540 


10 


CAAATAAAGA 


AACACGACAT 


ATAGAATTTT 


TACTTGATGA 


TTTTAGTGAA 


TCATATGAAC 


600 


CAGGAGATTG 


TATAGTAGCA 


TTACCGCAAA 


ACGACCCTGA 


ATTGGTTGAA 


AAACTAATAT 


660 




CCATGTTAGG 


TTGGGATCCG 


CAATCTCCC5G 


TGC CAATTAA 


TGATCATGGT 


GATACAGTTC 

*J*» X J^\v-rlw X X V~ 


7^fl 
f «u 


IS 


CTATTGTTGA 


AGCACTAACA 


TPAPATmYT 

A Vp*4*>m X X X A W 


AATTTAP/TAA 


ATTAACATTG 


PP A TTATTY3A 
VwVAJ, xnx i wi 


780 




AAAATGCAGA 


TATCTATTTT 


GACAATGAAH 


AATTPATPTGA 

X X X V-» X VJ^» 


ACGTATTCAA 
.nv_-vj x n x x \m~fyjn 


OATGAGTPAT 
vjn x UiwJ x wi x 


A a n 




. GGGCGOGTGA ATATGTTATA 


AA r rr , GGGAf ,r r 


, i"i'R f r t Rr^R i i i, i''i' 

X XnXnOnX 1 X 


AATAAPAGAT 


X X ILLnn^ln 


onn 




TAGAATTACA 


ACCTGAGAAT 


ill v> x AX v»ftnn 


TPPTTfi G A A A 
X V.V* X inunnn 


ATT APPAPP A 


AGAfiAf-TATT 
rturtvj/iU X n X X 






CGATTTCTAG 


TAGTTTTATG 


gpaapgp^ag 


21 TG A AGTGPA 
n X unnv X VjV_a 


T ATT A PPf-TT 
XnX Invvwl X 


\9\9 X nV.V7V> XXV, ' 






GTTATCAAGC 


ACATGGACGT 


V3nVxn\jnnnnV7 


GTGTATGPTP 
ululnl v» v» X v- 


V»Vy l x v»nl XXX 


v»v^ IviHIjv-uAn 


luoU 


25 


TTAAACCAGG 


CGATATAGTA 


v^ivill Inl X 


iuiUiuHnnn/i 


TCCY2 A A fTTT* 


nnn 111 Lv.\tA 


x 1^ U 




. 1 LxnAvsV-AnljA 


InlnV-(-vi\Jl 1 


X X a X Vxn. X X V> 


G A PP A fZHT A P 


TGt* A A TTGPT 
XV7X>nnX 1 Vjv» 1 


v. V. X XXI nvxnVv 




30 


CATATTTACA 


AGAACGTGAA 


VaAnL X X VxVJ X n 


TY^APTYZfSA A A 
X V?nV~ X V7V»nnn 


A A p ATY-TSTTP 


XVtVvX V7 




ATCAACACCG 


TAGTTCTGAC 


X X X X XnXnXVs 


AAGAAGAAAT 


AGAAGAATGG 
rturirturtn x \jVt 


PTTf^ A & A A TT2 
V. X XUAAMnlu 






GAAACTTAAC 


ACGCGTAGAT 


TT A GP A TTT'T* 


CAAGAGAP_P_A 


AGAAPAPJVAA 


GAATATGTAr' 
VJtnn X n 1 V7 X n V. 




35 


AGCATCGTAT 


AATGGAAGAA 


AG TAAAPGTT 

n\J X /Vlrtv^VJ X X 


TPAATGAATG 

X WVl X X >J 


GATTGAGPAA 
van x x vanov-nn 


riricczc A PA AT 

VTVjVj.va'Vvnv-nn x 






CTATATTTGT 


GGCGATGAAA 


AATGTATGGG 


GAAAGATGTC 


CATCAAGCCA 


TTAAAGATGT 


1500 




ATTGflTAAAA 


GAACGTCATA 


TTTCTCAAGA 


AGAAGCAGAG 


TTATTATTG C 


GACAAATGAA 


1560 


40 


ACAACAACAA 


CGCTATCAAC 


GTGATGTTTA 


TTAGCGATTG 


GTGTTAAATA 


TXTTAAGGTG 


1620 




TAATGATGTA 


AAAAGATATA 


AAGGATGTTG 


CTCAAGATGA 


ATATGC CATT 


AATGATAGAT 


1680 




TTAACAAATA 


AAAATGTGGT 


CATAGTTGGT 


GGAGGCGTCG 


TTGCAAGTCG 


TCGGGCACAA 


1740 


45 


ACATTAAATC 


AATACGTTGA 


ACATATGACG 


GTCATCAGTC 


CGACAATCAC 


TGAAAAACTT 


1800 




CAAAATATGG 


TAGATAACGG 


TGTCGTCATA 


TGGAAAGAAA 


AAGAATTTGA 


ACCAAGCGAT 


1860 




ATTGTAGACG 


CGTATCTAGT 


TATTGCAGCA 


ACCAATGAGC 


CACGTGTCAA 


TGAAGCGGTA 


1920 


50 


AAAAAAGCCT 


TACCTGAGCA 


TGeccrrnT 


AATAATGTTG 


GAGATGCATC 


AAATGGCAAT 


1980 




GTTGTATTTC 


CAAGTGCACT 


ACACCGCGAC 


AAGCTAACTA 


TCAGTGTATC 


AACTGATGGT 


2040 
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10 



15 



20 



TACAGTTCGT ATATCGACTT TTTATATACT TGCCGACAGA AAATAAAAGT ACTTGATATA 2160 

ACATATAACG AAAAGCAACA GTTACTGTCA CAAATTGTGT CACAAGAATA TTTAAATCAT 2220 

GACAAACAAG CTCAATTTTT AGCGTGGTTG GATGTAAGAT AATAATAGCG GACCGTGTAA 2280 

CCGTCTAAGG TAAGTCTTCT TATTTTAACT TTAACGCTTA ATCATTGAAA TTAAGACATG 2340 

GGCGGCTTTG TGAATAGTCT AATAATGAAG GATTTAAGCG ATAATGATAT GCGTTTTAAA 2400 

TATGAATATT ACAATAGAGA AAAAGATACG TAGAACAAAC TTAATAAAAT AGGTGGATAA 2460 

ATTGAAATCT GGTTGAAGTC GTTACTATCA TAGCGACCTT TAGCCAGATT TTTTGTGCAA 2520 

TAGAAAGCAA TAATAAAAAT GATAGATCAA AATGAAATAC AGGACAGGAT ATACAAGGAT 2580 

TAGTCATGCC ATGTTATCAA GTAGG AAAAT CAAACTTCAC TATTGATAGT TACGCAAAAA 264 0 

AGATTTTTTT GATAAAATGA GATAACTTAA ATATAAAAAA TTATATTAAT TATAATATTT 2700 

AAGTTAAAGA GGGGGATTAT GTAAATTGTA TTAAAAGTGG AGGGAGAAAA TAATATGAAT 2760 

AGTGATAATA TGTGGTTAAC AGTAATGGGG CTCATTATTA TTATTTCAAT TGTAGGTTTA 2820 

CTCATTGCCA AAAAGATAAA TCCAGTTGTA GGTATGACAA TCATACCTTG CTTAGGGGCA 2880 

26 ATGATTTTAG GATATAGTGT GACAGATTTG GTTGGATTTT TTGCTAAAGG GTTAGATCAA 2940 

GTCATCAACG TTGTTATTAT GTTTATCTTT GCCATTATTT TCTTTGGCAT CATGAACGAT ' 3000 

' AGTGGTTTAT TCAAGCCGCT TGTCAAACGC TTAATATTAA TGACACGAGG CAATGTCGTC 3060 

30 

ATTGTCTGTG CAATGACAGC TTTAATTGGC ACAATAGCCC AATTAGATGG GGCCGGTGCG 3120 

GTAACATTTT TGCTTTCTAT TCCTGCATTA TTACCTTTAT - ATAAAGCGTT AAATATGAAT 3180 

AAATATTTAT TGATTTTACT ATTAGCATTA AGCGGGGCGA TTATGAACAT GGTACCTTGG 324 0 

35 

GGAGGTCCAA TGGCTCGTGT AGCTGCAGTG TTAAAAGCCA AAAGTGTCAA TGAATTATGG 3300 

TATGGATTAA TACCTATTCA AATAATAGGT TTCATTCTTG TTATGTTGTT TGCGGTATAT 3360 

4Q CTTGGATTTA AAGAACAGAA ACGTATCAAA AAAGCAATAG AGAGAAATGA ATTACCGCAA 3420 

ACACAAGATA TAGATGTACA TAAATTAGTT GAAGTATATG AACGAGATCA AGATGTAAGG 348 0 

TTTCCTGTAA AAGGACGTGC AAGAACAAAA TCATGGATAA AATGGGTGAA TACAGCTTTA 354 0 

45 ACTTTAGCTG TTATTCTATC GATGTTAATA AATATTGCGC CACCTGAATT TGCATTCATG 3600 

ATAGGTGTTy CGTTGGCACT TGTTATTAAT TTTAAATCAG TGGATGAACA AATGGAACGA 3 660 

TTAAGAGCgC ATGCGCCGAA TGCATTAATG ATGGCTGCAG TGATTATTGC AGCAGGTATG 3720 

50 TTTTTAGGTG TACTAAATGA AACCGGTATG CTTAAAGCGA TTGCGACCAA TTTAATCAAA 3780 

GTGATTCCTG CAGAAGTAGG ACCATACTTG CATATTATTG TAGGTTTACT TGGCGTACCA 3840 
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ACAGCAGGGC 


■ AATTTGGTGT 


ACCGTCTGTA 


. TCAACAGCTT 


ATTCAATGGT 


CATAGGGAAT 


J JOU 




ATTATAGGTA 


CATTTGTCAG 


CCCATTTTCA 


CCAGCCTTAT 


GGTTGGCAAT 


TGGTTTAGCA 


4020 


5 


GAGGCAAACA 


TGGGCACGTA 


TATTAAGTAT 


GCATTCTTTT 


GGATTTGGGG 


ATTCGCTATC 


4 080 




GTTATGTTAG 


TAATTGCAAT 


GTTGATGGGC 


ATTGTGACGA 


TTTAAGTATG 


AAAAAATAGA 


4140 


10 


AACTATGGTC 


ACGTTGCAAA 


ATGAAATAAT 


AGTTGCATAA 


ACATGTCGAA 


ATGACGGACG 


4200 


AATCTTTAAA 


CAATTTTAAA 


AATTAATGAA 


ATAATTGTGT 


AGAAATATGA 


ATTTCACTAA 


4260 




ATGTTAATAA 


CTTTGTGACG 


TTTTAGTTAA 


CAGACTAATA 


AAAATTTGAA 


AATACTATAT 


4320 


15 


ATAGTGGTAT 


AACGTAATGA 


GTAGACACAA 


TATATAGGAA 


GAAGGGGTAA 


AATGAATCAA 






ATCGAAGAAG 


CATTAACGGG 


TTTGATTTCT 


AAAGATCCTG 


CTATTGTTAA 

-t^-k x x\^x inn 


CGAAAATGtT 


AAA ft 




AACAAAGATA 


GTGATACATT 


TTCAACAATG 


AGAGATTTAA 


CAGCAGGTAT 


v—o x x x w inn/i 






TCTTACGCAT 


TAAATCATTT 


ATTACCAAAG 


CACGTTGCAG 


ATGCACATCA 


AAGAGGGGAr* 






ATACATTTT C 


ACGACTTAGA 


TTATCATCCA 


TTTCflAACOCn* 
x a wwmu^^7x 


i. ™iv». x /vie x \j 


x IVjl X Innln 


4a O ^ U - 




GATGCTAAAA 


ATATGCTACA 


TAATGGATTT 




nUULunA X V7 X 


X X UiLLn 


A C O ft 


25 


AAATCAATAC 


AAACTGCATC 


AGCGCAGCTT 


GTACyVAATTA 


TAGfT'AATGT 


X X V_ X X 


A "7 .A ft 




CAATATGGTG 


GCTGTAcGGT TGACCgCGTT 


GACGAATTAC 


t TAGTACATA 


TGC A PG A rr> A 


A O ft ft 




TAATGAAGAA 


CAACATAGGA 


ATATs CGCAA 


AGCAATTTGT 


CAAAGAATTT 


nAAATTHATf 


4 Q c ft 


30 


GTTATGTTGA 


TCAACAAGTC 


ACTAAAGACA 


TCAATGATGC 


GATTGAAAGT 




*m 27 a U 




AAATTAATAC 


CTTATATACA 


TCTAATGGAC 


AGACACCTTT 


TGTAACATTA 




d on ft 

** J o u 


35 


TAGGTACAGA 


TCATTTAAGT 


CGCAAAATTC 


AACAAGCTAT 


CTTAAATACT 


CGTATCAAAG 


C (1A ft 


GCTTAGGAAA 


AGACCGCACG 


ACAGCGATTT 


TCCCGAAACT 


TGTATTTTCA 


ATTAAAAAAG 


5100 




GAACQAACTT 


TAGTGCGCAA 


GATCCGAACT 


ATGACATTAA 


ACAACTAGCA 


TTAAAGTGTT 


5160 


40 


CAACGAAACG 


TATGTATCCA 


GATATTTTAA 


ATTATGACAA 


ACTCGTAGAA 


ATATTAGGTG 


5220 




ATTTCAAAGC 


GCCAATGGGT 


TGTCGTTCAT 


TTTTACCAAG 


TTGGAAAGAT 


GCGGAAGGTC 


5280 




ATTTTGAAAA 


TAATGGTCGT 


TGTAATCTTG 


GTGTTGTTAC 


ACTTAATTTA 


CCTAGAATGG 


5340 


45 


CATTAGAATC 


TGCCGGTAAT 


ATGACGAAAT 


TCTGGGAAAT 


CTTTTATGAA 


CGTATCGATG 


5400 




TGTTACATGA 


TGCATTACTT 


TATCGTATAA 


ATCGTTTGAA 


AGATGCTGTA 


CCGAATAACG 


5460 




CACCGATTTT 


ATATAAAAGT 


GGCGCATTTA 


ACTATAAATT. 


AAAAGAAACA 


GATGATGTTG 


5520 


50 


CTGAGTTATT 


TAAAAATAAA 


CGTGCAACGA 


TTTCAATGGG 


CTATATAGGG 


TTGTATGAAA 


5580 




CAGCTACTGT 


TTTCTATGGT 


CCAGACTGGG 


AAACATCTCA 


AGAAGCAAAA 


GCATTTACGC 


5640 
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GGTTCAGTAT TTmCAGTACG CCGAGTGAAT CGCTAcGGAT 


CGTTTTTGTC 


GTTTAGACCA 


3/Ow. 




AGAGAGATTT GGAGATATTA AAGACATTAC AGATAAAGGA 


TATTATCAAA ACTCTTTCCA 


5820 


5 


TTATGATGTA CGTAAAGATG TTACACCTTT TGAAAAGTTA 


GATTTTGAAA 


AAGATTATCC 


5880 




TTATTATGCG AGTGGTGGTT TCATTCACTA TTGTGAGTAT 


CCGAAATTGC 


AACACAATTT 


5940 


10 


GAAAGCACTA GAAGCGGTAT GGGACTACTC TTATGACAAA 


GTTGGTTACT 


TAGGTACAAA 


6000 


TATTC CGATT GATCATTGTT ATGAATGTGA TTACX3ATGGA 


GATTTTGAAG 


CAACTGAAAA 


6060 




AGGATTTAAA TGCCCGAACT GTGGCAATGA TAATCCTAAA ACAGTTGATG 


TCGTTAAACG 


6120 


15 


AACATGTGGT TACCTAGGCA ATCCAGTTCA ACGTCCAGTA 


ATTAAAGGCC 


GTCATAAAGA 


DXOv 




AATTTGCGCA CGAGTAAAAC ATATGAAAGC GCCTAAAGAA 


TGATACTTTT 


AGACATTAAA 


a*>A n 




CAAGGACAAG GTTATATTGC TAAAATAGAA TCAAATAGCT 


TTGTTGACGG 


TGAAGGAGTA 


OjUU 


20 


AGATGCAGTG TTTATGTATC AGGATGTCCA TTTAATTGTG 


TTGGATGTTA 


TAACAAAGCC 






TCACAAAAGT TCAGATATGG CGAGAAATAC ACTGATGAAA 


TATTAGCAGA AATATTAGAT 


- -6420 ' 




GATTGCGATC ATGATTATAT ATCTGGGCTA AGTCTATTAG 


GTGGCGAACC 


ATTTTGTAAT 


c a a a 
6480 


25 


TTGGATATTA CATTAAATCT TGTCAAAGCA TTTCGAGCAC 


GTTTTGGAAA 


TACAAAGACA 


654 0 




ATTTGGGTAT GGACTGGATT TTTATATGAA TATTTAGCAA 


ATGATTGTAC 


AGAACGTCGA 


6600 




GAGTTATTAT CATACATTGA CGTTTTAGTA GATGGTCTAT 


TTATACAACA 


CTTATTCAAA 


6660 


30 


CCTGATTTAC CATATAAAGG TTCTTTAAAT CAACGCATTA 


TAGATGTACA 


ACAATCACTC 


©720 




TCGCATGCGC GTATGATTGA ATATATAGTT AGTTGAATAT 


GTATTAGAAG 


TCAAGGXAAC 


ci q n 


35 


ATTCGTTGCC TTGGCTTCTT TTTAGGTTAG GTACATAATT 


G AAAGTT AAT 


AAAAGCAATT 


C QA A 


CTTTATAAAA ATATATTGAT AGAATATGAC CTAACAATCA 


TTTTGATACC 


AATACTAAAA 






GTTGCATATC CGTTTTTTAA AAAAGTTGAA AGAGAAAAGT 


GGTATTTTAG 


TGGGAAGGAA 


OJDU 


40 


GTCTAACTTT TTGGTAGCGT TTTACAATAA ATAAATATTC 


GTTAATAACG 


TATAAATATT 


7020 




CTTAAATGCC ATTCTAGTAA AATTTGTTAA ATTCGTTAAA 


TCGTAACTTA 


ACACTGTTAT 


7080 




TTTAGCGCTA TTAAGGTTTT GTTTATTACG GGAAAAATTA 


TATAAATATT 


CAATAATTGC 


7140 


45 


CAAGTTTCAA ATTGTATGAA ATTTGCATTA TTATTAAATG 


TTAGTTATTG 


TCAATTTTGT 


7200 




GAATCAATAT AATTATTACA TTTTGAGATA AATCGAAACA GGATTCATAA 


AATTAATAAT 


7260 




TAGGGGGAGC ACAATTGAAA AAAGAGAAAG TTATGGACTG 


GACGACCTTT 


ATAGGGACAG 


7320 


50 


TAG CTGT ACT TCTTTTTGCA GTTATACCTA TGATGGCTTT 


TCCAAAAGCA 


AGTGAAGATA 


7380 




TCATCACTGG TATTAATAGT GCCATTTCTG ATTCAATTGG 


TTCGATATAT 


TTATTTATGG 


7440 
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TTGGTAAAGC AAGTGATAAA CCAGAATTTA ATACATTTAC ATGGGCGGCA ATGCTGTTTT 7560 

GTGCAGGCAT AGGCTCTGAT ATTTTATACT GGGGCGTTAT TGAATGGGCT TTTTACTATC 7620 

AAGTTCCACC AAATGGCGCG AAAAGTATGA GTGATGAAGC ACTCCAATAT GCGACGCAAT 7680 

ATGGTATGTT CCACTGGGGG CCAATTGCTT GGGCTATTTA TGTTCTACCA GCATTACCAA 7740 

TTGGTTATTT AGTATTTGTT AAAAAACAAC CGGTGTATAA AATTAGTCAA GCTTGTCGTC 7800 

CGATTTTAAA AGGTCAAACA GATAAATTTG TAGGTAAAGT TGTAGATATC TTATTTATCT 7860 

TTGGATTGCT AGGTGGTGCG GCAACATCAC TAGCGTTAGG TGTGCCATTA ATTTCTGCAG 7920 

1S GCATAGAAAG ATTAACTGGT TTAGATGGTA AAAATATGAT TTTACGTTCG GCCATTTTAT 7980 

TAACAATCAC GGTTATATTT GCCATTAGTT CATATACAGG ATTGAAAAAA GGTATTCAAA 8040 

AGTTAAGTGA TATCAACGTT TGGCTATCCT TTGTACTTTT AGCCTTTATA TTTATTATTG 8100 4 

20 GACCGACTGT TTTTATTATG GAAACGACAG TGACAGGGTT CGGAAATATG TTGAGAGATT 8160 

TCTTTCATAT GGCAACATGG TTAGAACCAT TCGGTGGTAT TAAAGGTCGA AAAGAAACGA 8220 

ATTTCCCACA AGACTGGACA ATATTCTACT GGTCATGGTG GTTAGTATAT GCGCCATTTA 8280 

■ TCGGTTTATT TATCGCTAGA ATTTCAAAAG GTCGACGCCT TAAAGAAGTC GTGCTAGGAA 8340 

, CAATTATTTA TGGAACGCTT GGATGCGTAT TATTCTTTGG TATTTTTGGT AACTATGCTG 8400 

TGTATTTACA AATTTCTGGA CAGTTTAATG TAACACAATA TTTAAATACA CATGGTACAG 8460 

AGGCAACCAT TATTGAAGTG GTGCATCATT TAGCATTCCC ATCATTGATG ATTGTACTAT 8520 

TCTTAG TATC TGCTTT CTTA TTCTTAGCAA CAACATTTGA TTCGGGTTCA TATATTTTAG 8580 

: CGGCAGCATC TCAGAAAAAA GTGGTAGGCG AACCATTACG TGCCAATCGT TTATTCTGGG 8640 

' CATTTGCATT GTGCTTATTG CCATTTTCAT TGATGCTAGT TGGTGGTGAA CGTGGATTAG 8700 

AAGTATTGAA AACTGGTTCA ATACTGGCAA GTGTGCCATT AATTGTTATT TTTATTTTCA 8760 

40 TGATGATATC ATTTTTAATC ATTTTAGGGC GCGATAGAAT TAAACTTGAA ACGCGTGCTG 8620 

AAAAATTAAA AGAAGTTGAA CGTCGTTCAT TGCGAATCGT TCAAGTATCa GAAGAAGAAC 8880 

AAGACGATAA TTTATAATTC AAAGCGGGTC TGGGACGACG AAATGaATTT TGTGAAAATA 8940 

45 TCATTTCTGT TCCaTTCCCC TTTTTTTAGT AGCATTGTAG GATGAACTTT TAGGTTTTCA 9000 

TTAATGTTGT ACTAAAAGAT TTAATTTTTT AGTGCTCCAA GTACTTATTT ATTGTATGAA 9060 

GCATATTCTA AATCGAAGTT TGAAAGACTC TCATTGATTA TTAAATTAAA TAAAGGGTAT 9120 

SO 

GCGTATGTAC AATTCAAATT AATCGAAGGA TGAAATAAAA TGACTAATCA ATTTAAAAAT 9180 

AAACAGTCCA AATTACATGA CAGTTTAGAA TCCATCACAA AAAACTTATA TGCGACACCT 9240 
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10 



is 



20 



ACAGAATATT GTTATCTATC ATTCCGGACA CTTAGGTGAC TCCCAACAAG ACATTGCATC 93 60 

ATTAGGTGGT GTTTCAAAAG TATTGATGAA TCATGATCAT GAATCTATAG GAGGTTCTAA 9420 

TCAAGTTGAA GCCCCTTACT TTATACATGA AAATGATGTG GCTGCACTGA AACATAAGAT 9480 
TTCTGTTCAA AAACAATTTA GTAATCGTGT AATGTTGGAT AAGGATTTAG AAGTTATTCC 9540 
CGCGCCTGGA CATACACCAG GGACGACACT ATTTTTATGG GATGATGGTC ATCACCGTTA 9600 
CTTATTTACT GGAGATTTTA T ATGTTTTGA AGGGAAGAGA TGGCGTACAG TTATATTAGG 9660 
rrCAAGTGAT AGAGAAAAAT CTATTCAAAG TTTAGAGATG GTTAAAGAAT TAGATTTTGA 9720 
TGTACTTGTA CCTTGGGTTA CTATCAAAGA TGAACCGTTA GTTTATTTTG TAGAAAATGA 9780 
ATATGAAAAA CGTGAACAAA TACAAAATAT TATTGATAGA GTACGTGAGG GCGAGAATAG 9840 
CTAATTGAAA TATATTGGCG AAgCAATGTA ACGAATCTAA GAAAGCCCTA GAAAATACCT 9900 
CCATAATTGA TTGTCATATA AAAGAAAAAC GGTAATTTCT ATTTATTGAG ATAGAAATTA 9960 

CCGTTTATTT CGTGGACCTA TTGCATTGTT TTTATCATGC ATAATCATCA TTGTCGTTGT 10020 

TTGAGTCAAT TTTAATTTTC AGAATCAGAA ,GGGTGTTCTG GAATTGGGAA ATATTTGAAA 10080 

26 ATTTCACCGC TTTCAATCGC TTCGGTTAAC TGTTCTAACC ATTGGTAATA AACATGTGTA 10140 

TGATCAAGCT GAGCTTTAAT TTTTTGTGCC TCTTGTGTTT CAGCTTCAGT TAAATCACTG 10200 

CTTTCAAGTA ATGGATTGAT AATAGCTTGA GCATCTTTTA CTGCTTCGAC ATTGATGTCA 10260 

30 ATTTCACGCT GGAATTTTTT "AGTGAAAAAG TTTCGGAAAA AGATGAAAAA GTCTTTCTCG 10320 

GCGATAAAAT GTTGTTTGCG GGTTCCTCTC GTAAATTGTT GTTTAACAAT ATCAAATTCC 10380 

TGCAATTTCT TAACGCCAGC ACTCATACTT GGTTTGCTCA TTTGCAATTG ATGACGCATT 10440 

TCATCAAG CG TCATACTGCC TTCAAACACC ATTGTGCCAT ATAAGTTTCC TACACTTCTA 10500 

TTAGTG C CAT ACAAATCCAT TGTCTGTCCA ATTGAATTAA TTACAATATC TTTTGCTTGT 10560 

40 TCTAATTGTT GCTGTTTGTT GTGAGAACGA GTCATCATTG CACCTCCGTA CATCATTTTG .10620 

GTCACGTTAA AATAAATACT AATACATTAT AAAACCTTTT CTAAAAAAAG ACATTAAAAA 10680 

TATTTAAAGC ATTAAAGTTA AATGTTTCGT TAAATAAAAA TCTAACGAAC TTACAAAACT 10740 

45 TAATTCTTGA GTTGTTTTGT AAATTGACAC ATTTTTCATT TCTATGCTAA CATAAGTnTG 10800 

TAAAATTcGT TAAATAAAAA TTTAACAAAC TTAACGGrGG TTGTTGAAkG GrACTTTTAA 10860 
aACATTTATC TCAGCGTCAA TATATTGATG GTGAGTGGGT TGAAAGCGCG AAT AAAAAT A 10920 
50 CAAGAGATAT TATCAATCCT TACAATCAAG AAGTGATATT TACGGTTTCT GAAGGGACAA 10980 

AAGAGGATGC AGAACGTGCA ATCTTAGCTG CAAGACGTGC GTTTGAGTCT GGTGAATGGT 11040 
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AACATCgCGA AgCgTTAGCA CGATTAGAAA CATTAGATAC TGGAAAAACG TTAGAAGAAT 11160 

CATATGCAGA TATGGATGAT ATTCATAATG TGTTTATGTA TTTTGCTGGA TTAGCAGATA 11220 

AAGACGGTGG CGAAATGATT GATTCACCAA TTCCAGATAC AGAAAGCAAA ATTGTTAAAG 11280 

AACCAGTAGG TGTAGTTACA CAAATTACAC CTTGGAATTA TCCGTTATTA CAAGCATCAT 11340 

GGAAAATTGC GCCAGCGCTT GCTACGGGTT GTTCACTAGT TATGAAACCA AGTGAAATTA 11400 

CACCATTAAC AACAATACGT GTTTTTGAAT TAATGGAAGA AGTTGGTTTC CCTAAAGGAA 1146 0 

CAATTAATCT TATTCTAGGT GCAGGTTCTG AAGTTGGTGA CGTAATGTCA GGTCATAAAG 11520 

AGGTTGACCT TGTATCATTT ACAGGTGGCA TTGAGACTGG TAAGCATATT ATGAAAAATG 11580 

CTGCTAATAA TGTTACGAAT ATTGCCTTGG AACTTGGCGG TAAAAAT CCA AACATTATCT 11640 

TTGATGATGC TGATTTTGAA TTGGCAGTAG ACCAAGCGTT AAATGGTGGA TATTTCCATG 11700 

CAGGTCAAGT TTGTTCAGCA GGATCAAGAA TATTAGTACA AAACAGTATT AAAGACAAAT 11760 

TTGAGCAAGC ACTTATTGAT CGCGTGAAAA AAATCAAATT AGGTAATGGT TTTGATGCTG 11820 

ATACTGAAAT GGGACCAGTG ATTTCAACAG AACATCGTAA TAAGATCGAA TCTTATATGG 11880 

ATGTAGcTAA AGCAGAAGGC GCAACAATTG CTGTTGGTGG TAAACGTCCA GATAGAGATG 11940 

ATTTAAAAGA TGGTCTATTC TTCGAGCCAA CAGTCATTAC AAATTGTGAT ACGTCAATGC 12000 

GTATTGTACA AGAAGAGGTT TTCGGACCTG TCGTTACTGT AGAAGGCTTT GAAACTGAAC 12060 

AAGAAG CGAT TCAATTAGCG AATGATTCTA TATATGGTTT AGCAGGTGCT GTATTTTCTA 12120 

AAGATATTGG AAAAGCACAA CGCGTTGCTA ACAAGTTGAA ACTTGGAACG GTGTGGATTA 12180 

ATGATTT CCA TCCATATTTT GCACAAGCGC CATGGGGTGG ATACAAACAA TCAGGTATCG 12240 

GTAGAGAATT AGGCAAAGAA GGCTTAGAAG AGTACCTTGT TTCAAAACAC ATTTTAACAA 12 300 

ATACAAATCC ACAATTAGTG AATTGGTTTA GCAAATAAAA ATTAGATAAG GTGAGTGCCA 123 60 

TTGTAAGAAC ACAAGACACT CACTTTGTTT TGTATAAGTG GCGAAATGTT GATTGATAAT 12420 

TTGGACTAAA CGCAAAATGA ATCATAGATT ATTTCATTAC TGTTAGTAAC AATCGTAAAA 12480 

GGAAAAGCGA GTGTTTTGGT TAG CTAAGTT TAGCAATTCA ACGATAACCA ATCAGCCACT 12540 

AACAAATATT TCATGCAATA CTCACTTTGA AATACAACAA ACTTTGGAGG TCATAACGAT 12600 

GAGTAACAAA AACAAATCAT ATGATTATGT CATCATTGGA GGAGGCAGTG CAGGTTCTGT 12660 

ACTAGGTAAT CGTCTGAGTG AAGATAAAGA TAAAGAAGTC TTAGTATTAG AAGCGGGTCG 12720 

CAGTGATTAT TTTTGGGATT TATTTATCCA AATGCCTGCT GCGTTAATGT TCCCTTCAGG 12780 

CAATAAATTT TACGATTGGA TTTATTCAAC AGATGAAGAA CCACATATGG GCGGTCGTAA 12840 



55 



678 



EP0 786 519 A2 



10 



15 



20 



25 



TCAACGTGGT AATCCAATGG ACTATGAAGG CTGGGCAGAA CCAGAAGGTA TGGAAACTTG 12960 

GGATTTTGCG CACTGTTTAC CGTATTTTAA AAAATTAGAA AAAACATACG GTGCAGCGCC 13020 

TTATGATAAA TTTAGAGGCC ATGATGGACC AATTAAGTTA AAACGAGGGC CAGCAACGAA 13080 

TCCTTTATTC CAGTCATTCT TTGATGCAGG TGTTGAAGCA GGCTATCATA AAACACCTGA 13140 

TGTGAATGGA TTTAGACAAG AAGGTTTTGG ACCGTTCGAT AGTCAAGTAC ATCGTGGTCG 13200 

CCGAATGTCA GCTTCAAGAG CATATTTACA TCCAGCGATG AAGCGTAAAA ACTTAACCGT 13260 

TGAAACACGT GCCTTTGTAA CTGAAATTCA TTATGAAGGT AGAAGAGCAA CTGGTGTTAC 13320 

GTATAAGAAA AATGGCAAAC TACATACCAT CGATGCTAAT GAAGTCATTT TGTCTGGTGG 13380 

GGCATTCAAT ACGCCACAAT TACTACAATT ATCTGGTATC GGTGATTCAG AGTTCCTAAA 13440 

ATCAAAAGGC ATTGAGC CAC GTGTTCATTT ACCTGGTGTG GGTGAAAACT TTGAAGATCA 13500 

CTTAGAGG 13508 
(2) INFORMATION FOR SEQ ID NO: 121: 

(i) SEQUENCE CHARACTERISTICS: * 

(A) LENGTH: 7646 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
{ D ) TOPOLOGY : 1 inear 
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ixi) SEQUENCE DESCRIPTION: SEQ ID NO: 121: 
GTAAGTATTG T CTTGATTT C CTAATAAAGT TATATCTTGT AATTCATCTT GTTGACGGCC 
ATGTGCCATA TAAAGCGCTC CTTTAAATTT ATTTTTTTAT TATTTTGGCG TCTCGGCGTG 
CTTTTTCAAA CATGTAATAA CTTGCACCGA TAATAACGAC GTAACCTAAT GTTGCATAGA 
AATCSGGAGA TTCTCCGAAT, AGAATAAATC CAAGTATTGC TGTGAAAATT ATAGATGCAT 
ACGTAAAAAT AGAAATATCT TTTGCTGCTG CAAAACTATA TGCTAAAGTA ACACCAATTT 
GACCCACAGC GGCAgCTAAG CCAGCCCCTA ATAGATAAAG TATTTGCATC TGACTCATTG 
GTTCATAAGT ATATGCAGTG AAAGGTATTA AAACGATGAC AGAAAATAAG GAGAAGTAAA 
ATACTATAGT ATATGGTGCT TyTCTTGTAC TAAGTGCTCG AACACATGTA TATGCTGATG 
CTGCAAAAAT ACCTGAGAAT AAGCCAGCTA ATGATGGAAT CATAGATGAT GAAAATTCAG 
GTTTCACTAT TAAnAGCAaC CTAAAATAGC AATTATCATT GCTGTAATTT GaTACTTCCT 
TACCTTTTCA TGtAAGAaaA CAATGCTTaA TAAAATCGTC CAGAAAGGAT TGAGTTTCAT 
TAATGAATCG GCATCACTAA GTAC CATATG ATCAATGGCA TAAATATTTA ACAATACACC 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
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TGGCTGATGG TATTTATATA TAAAAAATAA TGGAATAAAC ATTGCTACTA AGTTTCGTGC 84 0 

TAATGATTTT TGAAAAACAG GAAGGTCACC TGCAAGTGTG AAAAACACTG ACATAAAACT 90 0 

5 

GAAACCAATA GCCGAAATTA AAATGGCAAT GATACCTTTT ACTTTAGGAT TCAATTTTAT 960 

CGCCTGTTTT ATATAAAATT AACGTATTTA TATTAGCATA AAACAACATG TTGTGCATAA 1020 

ATAGTTGAAA TTTACTATAA AAAGACTATA ATAGACTGTA GCGAACAAAC GTTCTGTGTT 1080 

10 

TATTTGTCGG AATAATAGGG CATTACACTT TTATGAATGT TTGTGTTATT ACATAAAACA 114 0 

AATATCAATT CAGTATCAAG CTAATAAGCT TTTTCTTGAT TTCTGTTGAT ACAATTGAGA 1200 

75 TTGACACAGA TTTAAAAAAA TCAAGTGATA TCTACTAAAA AATTTTTTTA AATTTGTTCA 1260 

AGTTTTTCTA ATTTAGTATT GGTGCCTAGT TGGAACGTTT TACGAACATT CGATTAGAAA 1320 

ATGGCACTTT AAATCATAGT GTGTCTTATG TATAATGAAA CACATAATAT AGTGTTGGTG 1380 

2 P AAACGAAAAA gACACAATAT CTTGTGTTTT GTATGCAAAT GCTTTATTTA TGAAGAAATT 144 0 

ACATTTAAAA GTAATTTAAC ACAGAAATTT AATAGTTATT ATCAATTAAT AGTCATATTT 1500 

TTAGAAAATG TACTGAGCAA ATGGAAGATA TCCAATGATG TAAACACTAC ATATAGTGAT 1560 

25 

TTTTATACAT TCAACCCATA TAAGCTACTA TTTTCTCAAA TATAAATCTA TGCAATTGGT 162 0 

TTACATTTGA GAAAATAAGT AGCTTCATTA TAGTTAATAC AATGCTGAGA TAACCATAGT 16 80 

AACCATGTTG TTAAAGCATT TTTTAATTGG AATGACTACT TTATTTAAAA GGGTTGAAGA 174 0 

30 

AAGAAGGTGA TCCAATGAAA ATAATATATT TTTCATTTAC TGGAAATGTC GGTCGTTTTA 1800 

TTAAGAGAAC AGAACTTGAA AATACGCTTG AGATTACAGC AGAAAATTGT ATGGAACCAG 1860 

3S TTCATGAACC GTTTATTATC GTTACTGGCA CTATTGGATT TGGAGAAGTA CCAGAACCCG 192 0 

TTCAATCTTT TTTAGAAGTT AATCATCAAT ACATCAGAGG TGTGGCAGCT AGCGGTAATC 1980 

GAAMTGGGG ACTAAATTTC GCAAAAGCGG GTCGCACGAT ATCAGAAGAG TATAATGTCC 2 040 

40 CTTTATTAAT GAAGTTTGAG TTACATGGAA AAAACAAAGA CGTTATTGAA TTTAAGAACA 2100 

AGGTGGGTAA TTTTAATGAA AACCATGGAA GAGAAAAAGT ACAATCATAT TGAATTAAAT 2160 

AATGAGGTCA CTAAACGAaG AGAAGATGGA TTCTTTAGTT TAGAAAAAGA CCAAGAAGCT 2220 

45 TTAGTAGCTT ATTTAGAAGA AGTAAAAGAC AAAACAATCT TCTTCGACAC TGAAATCGAG 2280 

CGTTTACGTT ATTTAGTAGA CAACGATTTT TATTTCAATG TGTTTGATAT TTATAGTGAA 2340 

GCGGATGTAA TTGAAATCAC TGATTATGCA AAATCAATCC CGTTTAATTT TGCAAGTTAT 2400 

50 

ATGTCAGCTA GTAAATTTTT CAAAGATTAC GCTTTGAAAA CAAATGATAA AAGTCAATAC 2460 

TTAGAAGACT ATAATCAACA CX3TTGCCATT GTTGCTTTAT ACCTAGCAAA TGGTAATAAA 2520 

55 



680 



EP 0 786 519 A2 





ACATTTTTAA 


ACGCAGGCCG TGCGCGTCGT GGTGAGCTAG 


TGTCATGTTT CTTATTAGAA 


2640 




GTGGATGACA 


GCTTAAATTC AATTAACTTT ATTGATTCAA CTGCAAAACA ATTAAGTAAA 


2700 


5 


ATTGGGGGCG 


GCGTTGCAAT TAACTTATCT AAATTGCGTG . 


CACGTGGTGA AGCAATTAAA 


2760 




GGAATTAAAG GCGTAgCGAA AGGCGTTTTA CCTATTGCTA AGTCACTTGA AGGTGGCTTT 


2820 


10 


AGCTATGCAG 


ATCAACTTGG TCAACGCCCT GGTGCTGGTG 


CTGTGTACTT AAATATCTTC 


2880 


CATTATGATG 


TAGAAGAATT TTTAGATACT AAAAAAGTAA 


ATGCGGATGA AGATTTACGT 


2940 




TTATCTACAA 


TATCAACTGG TTTAATTGTT CCATCTAAAT 


TCTTCGATTT AGCTAAAGAA 


3000 * 


15 


GGTAAGGACT 


TTTATATGTT TGCACCTCAT ACAGTTAAAG AAGAATATGG TGTGACATTA 


3 06 0 




. GACGATATCG 


ATTTAGAAAA ATATTATGAT GACATGGTTG 


GAAACCCAAA TGTTGAGAAA 


3120 




AAGAAAAAGA ATGCGCGTGA AATGTTGAAT TTAATTGCGC AAACACAATT ACAATCAGGT 


J)10U 


20 


TATCCATATT 


TAATGTTTAA AGATAATGCT AACAGAGTGC 


ATCCGAATTC - AAACATTGGA 


o -j a n 




CAAATTAAAA TGAGTAACTT ATGTACGGAA ATTTTCCAAC 


TACAAGAAAC TTCAATTATT 






. AATGACTATG 


GTATTGAAGA CGAAATTAAA " CGTGATATTT 


CTTGTAACTT GGGCTCATTA 




25 


AATATTGTTA 


ATGTAATGGA AAGCGGAAAA TTCAGAGATT 


CAGTTCACTC TGGTATGGAC 


*a a *> n 




GCATTAACTG 


TTGTGAGTGA TGTAGCAAAT ATTCAAAATG 


CACCAGGAGT TAGAAAAGCT 


■a a a t\ 




AACAGTG AAT 


TACATTCAGT TGGTCTTGGT GTGATGAATT 


TACACGGTTA CCTAGCAAAA , 


J 3n U 


30 


AATAAAATTG 


GTTATGAGTC AGAAGAAGCA AAAGATTTTG 


CAAATATCTT CTTTATGATG 






ATGAATTTCT 


ACTCAATCGA ACGTTCAATG GAAATCGCTA AAGAGCGTGG TATCAAATAT 


jODU 


35 


CAAGACTTTG 


AAAAGTCTGA TTATGCTAAT GGCAAATATT 


TCGAGTTCTA TACAACTCAA . 


3720 


GAATTTGAAC 


CTCAATTCGA AAAAGT ACGT GAATTATTCG 


ATGGTATGGC TATTCCTACT 


3780 




TCTGAGGATT 


GGAAGAAACT ACAACAAGAT GTTGAACAAT 


ATGGTTTATA TCATGCATAT 


3840 


40 


AGAtTAGCAA TTGCTCCAAC ACAAAGTATT TCTTATGTTC 


AAAATGCAAC AAGTTCTGTA 


3900 




ATGCCAATCG 


TTGACCAAAT TGAACGTCGT ACTTATGGTA 


ATGCGGAAAC ATTTTACCCT 


3960 




ATGCCATTCT 


TATCACCACA AACAATGTGG TACTACAAAT 


CAGCATTCAA TACTGATCAG 


4020 


45 


ATGAAATTAA 


TCGATTTAAT TGCGACAATT GAAACGCATA 


TTG AC CAAGG TATCTCAACG 


4080 




ATCCTTTATG 


TTAATTCTGA AATTTCTACA CGTGAGTTAG 


CAAGATTATA TGTATATGCG 


4140 




CACTATAAAG 


GATTAAAATC ACTTTACTAT ACTAGAAATA 


AATTATTAAG TGTAGAAGAA 


4200 


50 


TGTACAAGTT 


GTT CTATCTA ACAATTAAAT GTTGAAAATG 


ACAAACAGCT AATCATCTGG 


4260 




TCTGAATTAG 


CAGATGATTA GACTGCTATG TCTGTATTTG 


TCAATTATTG AGTAACATTA 


4320 
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SO 



ATGTTTTGGA 


GACAAAATAT 


ATCTCAAATG 


TGGGTTGAAA 


CAGAATTTAA 


AGTATCAAAA 


4440 


GACATTGCAA 


GTTGGAAGAC 


TTTATCTGAA 


GCTGAACAAG 


ACACATTTAA 


AAAAGCATTA 


4500 


GCTGGTTTAA 


CAGGCTTAGA 


TACACATCAA 


GCAGATGATG 


GCATGCCTTT 


AGTTATGCTA 


4560 


CATACGACTG 


ACTTAAGGAA 


AAAAGCAGTT 


TATTCATTTA 


TGGCGATGAT 


GGAGCAAATA 


4620 


CACGCGAAAA 


GCTATTCACA 


TATTTTCACA 


ACACTATTAC 


CATCTAGTGA 


AaCAAACTAC 


4680 


CTATTAGATG 


AATGGGTTTT 


AGAGGAACCC 


CATTTAAAAT 


ATAAATCTGA 


TAAAATTGTT 


4740 


GCTAATTATC 


ACAAACTTTG 


GGGTAAAGAA 


GCTTCGATAT 


ACGACCAATA 


TATGGCCAGA 


4800 


GTTACGAGTG 


TATTTTTAGA 


AACATT CTTA 


TT CTT CTCAG 


GTTT CT ATTA 


TCCACTATAT 


4860 


CTTGCTGGTC 


AAGGGAAAAT 


GACGACATCA 


GGTGAAATCA 


TTCGTAAAAT 

* X WW X Jmmmdmmh- X 


tltititAGAT 

a w x x x x n>jr> x 


4920 


GAATCTATTC 


ATGGTGTATT 


TACCGGTTTA 


GATGCAGAGC 


ATTTACGAAA 


a v«nn w x r» x w x 


4980 


GAAAGTGAGA 


AACAAAAAGC 


AGATCAAGAA 


ATGTATAAAT 


TGCTAAATGA 

x vw x fwin x 


PTTflTATTTA 

^1 iV3 X X\ X x X X* 


504 0 


AATGAAGAGT 


CATACACAAA 

X XV%rXWvXVXlXV 


AATGTTATAC 


GATGATCTTG 

WVX wXl X W X 4 V 


GAATCACTGA 

X WA W X V*XV 


AGATGTGCTA 
A»n x \s x vj^w x xv 


. 5100 


AACTATG TTA 


AATATAATGG 


AAACAAAGCA 


CTTTCAAACT 

W XXX %»XW^N* X 


X X X VJCl 


yy rv"**p*T*Tv XTTT 

Hw\» X Inl XXX 


5160 


GAGGAACGTG 


AATTTAA CC*C* 


AATCATTGAG 


A ZVTPG C PTTJVfl 


ATACAACAAC 




5220 




CAGTAAAAGG 


T*d JVTflrt" l ~ l " AT 


GTATTAGCAT 


TAAACGTAGA 


AGCATTACAA 


52flO 


GATGATGACT 


TTG TATTTGA 


CAACAAATAA 


CAATTAAATT 


AAAAGACCTT 


CACATGTAAA 


5340 


GGGAAATAGC 


GATTCGTTTC 


GTCTTGTCTC 


CTACATGTTG 


AAGGTCTTTT 


TTTATGTGTA 


5400 


TCTAACTCAT 


TATGAGTCTG 


AGTAAGAAAT 


CAATGCTCTA 


AGATGTAGAA 


TG PTATTTAT 


5460 


ATTGGCAGTA 


GTTGGCGGGG 


CCCCAACACA 


GAAGGAGGCG 


GAAAGTCAGC 


TAACAATATT 


5520 


GTGCAAGTTG 


GCGGGGCCCC 


AACATAGAAG 


CAGGCGGAAA 


GTCAGCTAAC 


AATAATGTGC 


5580 


AAGTTGGCGG 


GGCCCCAACA 


TAAAAGCAGG 


CGGAAAGTGA 


GCTAACAATA 


TTGTGCAAGT 


5640 


TCGGgCGGGG 


CCCCAACATA 


AAGAAAAACT 


TTTTCCTTTA 


GAAATTATCA 


CTTCCaCaTG 


5700 


AGTTTTACTC 


ATGTATTCCT 


ATTTTTAAGT 


ACACATTAGC 


TGAGGCTAAT 


GTTAAGAACC 


5760 


ACTACTTAAT 


CAATCATTAG 


TAGTTTTTAT 


CATTTCCACT 


ATTCCCaGAC 


ATCaAAATCT 


5B20 


TAAGTGTTCT 


ATTTTACTTT 


AAGTAAAGAA 


AATACACATT 


CCGAAAAATT 


AAATTTCAGT 


5880 


TTAATTGCAA 


ATATCAATAA 


AATTGACACT 


AAATT ATTTG 


AAAGG CTATT 


GAAATTATGG 


5940 


TCAAAAAACG 


CTACTATTAA 


TGAGAAATAT 


TATCAATGAT 


AATGATTATC 


ATTAATTTAA 


6000 


AGGGAGAAAA 


ATTTGTAATG 


AAGTATTTAT 


TAAAGGGAAA 


TATTTTGCTT 


CTATTACTAA 


6060 


TATTGTTGAC 


AATTATTTCG 


TTG TT CAT AG 


GTGTGAGTGA 


ACTATCAATT 


AAAGATTTAC 


6120 



682 



EP 0 786 519 A2 



10 



is 



20 



25 



35 



40 



50 



GTATTTTAAT TGCTGGAAGT TCGTTGGCTT TAGCAGGCTT GATAATGCAA CAAATGATGC 6240 

AAAATAAGTT TGTTAGTCCG ACTACAGCTG GAACGATGGA ATGGGCTAAA CTAGGTATTT 6300 

TAATTGCTTT ATTGTTCTTT CCAACCGGTC ATATTTTATT AAAACTAGTA TTTGCTGTTA 6360 

TTTGCAGTAT TTGCGGTACG TTTTTATTTG TTAAAATCAT TGATTTTATA AAAGTGAAAG 6420 

ATGTCATTTT TGTACCGCTT TTAGGAATTA TGATGGGTGG GATTGTTGCA AGTTcACAAC 64 80 

CTTCATCTCA TTGCGCACGA ATGCTGTTCA AAGCATTGGT AACTGGCTTA ACGGGAACTT 654 0 

TGCCATTATC ACAAGTGGAC GCTATGAAAT TTTATATTTA AGTATTCCTC TTTTAGCATT 6600 

GACATATCTT TTTGCTAATC ATTTCACGAT TGTAGGAATG GGTAAAGACT TTACTAATAA 6660 

TTTAGGTTTG AGTTACGAAA AATTAATTAA CATCGCATTG TTTATTACTG CAACTATTAC 6720 

AGCATTGGTA GTGGTGACTG TTGGAACATT ACCGTTCTTA GGACTAGTAA TACCAAATAT 6780 

TATTTCAATT TATCGAGGTG ATCATTTGAA AAATGCTATC CCTCATACGA TGATGTTAGG 6840 

TGCCATCTTT GTATTATTTT CTGATATAGT TGG CAGAATT GTTGTTTATC CATATGAAAT 6900 

AAATATTGGT TTAACAATAG GTGTATTTGG AACAATCATT TTCCTTATCT TGCTTATGAA 6960 

AGGTAGGAAA AATTATGCGC aACAATAATA AAAAAATAAT GCTTTTAATT GCAGTAACGT 7020 

TATTAATTAG TATGCTGTAC TTATTTGTAG GTATTGATTT TGAAATATTT GAATATCAAT 7080 

TTTCAAGTCG TTTAAGAAAG TT CAT ATT AA TTATTTTAGT AGGTGCTGCC ATTGCAACTT 7140 

CAGTGGTGAT TTTTCAAGCG ATTACAAATA ACCGTCTATT GACACCATCA. ATAATGGGGT 7200 

TAGATGCAGT TTATTTATTT ATCAAAGTAT TGCCAGTCTT TTTATTTGGA ATTCAATCGG 7260 

TATGGGTTAC TAATGT ATAT TTGAACTTTA TATTAACACT TATAACGATG GTGTTATTCG 7320 

CACTAATCCT ATTCCAAGGT ATCTTTAAAA TCGGACATTT TTCAATTTAT TTTATCTTAC 7380 

TTAJTGGTGT CCTTTTAGGA ACATTTTTTA GAAGCATAAC AGGTTTTATT CAACTGATTA 7440 

TGGATCCTGA GTCATTTTTA GCAATACAAA GTAGTATGTT TGCTAATTTT AATGCTTCTA 7500 

ATTCGAATTT AGTTACTTTC TCAGCAGTGC TATTAGTAAT CTTATTAGTC ATTACAATTT 7560 

TACTATTGCC TTATTTAGAT GTATTGCTTT TAGGTCGTGC TGAAGCAATT AATCTTGGGA 762 0 

TATCGTATGA AAAATTAACG CGAATT 7646 
(2) INFORMATION FOR SEQ ID NO: 122: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1194 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



55 
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(xi) SEQUENCE DESCRIPTION : SEQ ID NO: 122: 

ATGAATATAT TTnnAAATAA ATTATTATGG ATTGCACCAA TnGCCACTAT GATTATCTTG 60 

GTAATCTTTT CTTTAGCTTT TTATCCTOCA TATAATCCTA AACCAAAAGA TTTACCAATT 120 

GGTATATTAA ACGAGGATAA AGGTACAACG ATTCAAGATA AAAATGTTAA CATTGGTAAA 180 

AAATTAGAGG ATAAATTATT AGATAGTGAT TCTAATAAAA TTAAATGGGT TAAGGTTGAT 240 

AGTGAAAAAG ACCTTGAAAA AGATTTGAAA GATCAAAAAA TCTTTGGAGT AGCTATTATT 3 00 

GATAAAGACT TTTCAAAAGA TGCTATGAGT AAAACACAAA AAGTAGTTAT GGATAGTAAA 360 

AAAGAAGAAA TGCAACAAAA AGTTGCTTCA GGTGAAATTC CGCCACAAGT GGTTCAACAA 420 

ATGAAACAAA AAATGGGGAA TCAACAAGTA GAGGTTAAGC AGGCTAAATT TAAAACGATT 4 80 

GTAAGTGAAG GATCAAGCTT ACAAGGTTCA CAAATTGCAT CAGCTGTGTT AACTGGTATG 540 

20 GGTGATAATA TTAATGCTCA AATTACGAAG CAAAGTTTGG AAACATTAAC GAGTCAAAAT 600 

GTTAAAGTCA ATGCCGCGGA CATCAATGGT TTGACGAATC CAGTAAAAGT GGATAATGAA 660 

AAACTTAATA AAGTTAAAGA TCACCAAGCA GGTGGTAATG CACCATTCCT AATGTTTATG 720 

25 CCAATTTGGA TAGGTTCAAT CGTAACGTCT ATCTTATTGT TCTTTGCATT TAGAACTAGT 780 

AACAATATCG TCGTGCAACA TCGTATCaTT GCtTCAATTG GACAGATGAT ATTTGCAGTT 840 

* GTTGCAGCAT TTGCAGGTAG CTTTGTTTAT ATTTATTTCA TGCAAGGCGT TCAAAGATTT 900 

GATTTTGACC ATCCAAATCG TATCGCAATT TTTGTAGCAT TTGCGATTCT TGGTTTCGTG 960 

GGCCTTATTT TAGGTGTTAT GGTATGGCTA GGTATGAAGT CAGTTC CAAT TTTCTTCATT 1020 

' ' TTAATGTTCT TTAGTATGCA ACTTGTAACG TTACCTAAAC AAATGTTGCC TGAAAGTTAT 1080 

CAAAAATATG TATATGATTG GAATCCATTC ACACACTATG CAACAAGTGT AAGAGAcTAT 114 0 

TATAClTGAA T CAT CAT ATT GAATTAAATA GTACAATGTG GATGTTTATA GGGT 1194 
40 (2) INFORMATION FOR SEQ ID NO: 123: 

(i) SEQUENCE CHARACTERISTICS r 

(A) LENGTH: 558 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
45 (D) TOPOLOGY: linear 



30, 



35 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 123: 

SO 

GACCGACCTA TACATCCGTA TAAGTATTTC TTGATATAAG TCTTCTAAAT CATAATGATT 60 

AAATCCAAAT GTTTTGATGC GTCGAATAAT TAATGGTTGT AGATCCATTA CTAACTTTTC 120 

55 
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GTATTTCAAA TATTAAACTA ACCCCTTCTA TCTAAAATTT AAGGTTAGTT 


TAATATTGTT 


240 




ACATTCAAAA TTTCAAGATG ACGGAAATGT CATTTCTTAT GATGTCCTCT 


TCGTATTTTT 


300 


5 


TCAAATTCTG CAAGGATTTC AGAAGATAAC GGAATTCGAG TTCTTGGCTT 


GTTTTCACTT 


360 




ATATCATCTA ATGATTTACT CACATCAATT TCATTTTCTT TTAAATCTCT 


CCACATTTCG 


420 




CGAGATGATA TTCTATATGC ACCTGATCCA AAGATAGCAT GTTGcTCACT CaTATCACTT 


480 


10 


GTTACAACTG TAATATGcTT AGtATGCTTG tCaTAAAGtT CaTAAACCAT 
ATGGAAACCA ATCAGCTG 


AACGGTTCTA 


540 
558 


1S 
20 


(2) INFORMATION FOR SEQ ID NO: 124: 






(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7762 base pairs 
<B) TYPE: nucleic acid 
(C> STRAND EDNESS : double 
(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 124: 






25 


GCTTCAGACA TnTGATGATA TAATCTCTCA TCATCGATTA ATTCTTTTGC AGCTTGATAC : 


60 




ACATnTTGCT TATTTGTTCC AATGACTTTT AATGTGCCAG CTTCAACACC 


TTCAGGACGT 


120 




TCTGTAACAC TTCGCCAAAA CTAAAACTGG CTTATTAAAT GATGGCGCTT 


CTTC CTGAAT 


180 


30 


TCCACCTGAA TCTGTCAAAA TAAAATAAGA TTTTnTAGCA AAATTATGGA 


AATCTATACG 


240 




TCCAAAGGTT CAATCAATTC AATT CTGTC A TGACTACCTA AAATci~l u lTG 


AGCCACCTCT 


300 




CGAACTTTCG GGTTTTTATG CATTGGATAT ACCAGTGCTA AATCAGTATA 


CTCATCTATT 


360 


35 


AAGCGTCTAA CCGCTTTAAA TATATTTTCC aTGGGTTTCC CGATATTTTC 


TCGTCGGTGT 


420 




GCTGTCATrA GAATGAATTT kTtGTCATGG TATTTATCCA TGATGTTAGA 


TTTATAATTG 


480 


40 


TCATCAACTG TATATTTCAT AG CATCAAT C GCAGTATTAC CAGTGACAAC 


AACACTTTCT 


540 


GAATATTTCC CTTCACTTAA CAAATGCGAT GCAGCATTTT TAGTAGGTGC 


AAAATGTAAG 


600 




TCAGCTAATA CACCAACTAA TTGTCTATTC ACCTCTTCTG GAAAAGGTGA 


ATATTTATCA 


660 


45 


TAACTTCTAA GCCCTGCTTC AACGTGTCCA ATCGGCACTT GGTTATAAAA 


TGCCGCTAAA 


720 




CCACCTGCAA ATGTCGTCAT CGTATCACCA TGTACAAGTA CCATGTCTGG 


TTTTT CTAAT 


780 




TGAATCACTT GTTCTAATTG AGTGATTGAT TTAGAAGTTA TCTCAGAAAG 


TGTCTGTCCT 


840 


50 


GATTTCATAA TATTCAAATC GTATTTTGGT TTGATTTCAA AGGTACTTAA 


TACTGAATCA 


900 




AGCATTTCTC TATGCTGTGC TGTAACAACA ACAATTGGCT CGAGCATTTT 


TTCTTGTTCC 


960 
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ATCTTTTTCA 


TCAAACTACT 


TATCTCCGAT 


TCTTCTATTT 


AGTACCAAAC 


AATCTATCTC 


1080 




CAGCGTCGCC 


TAACCCTGGT 


GTGATATATG 


CTTTGTCATT 


aGCTTTTCAT 


CAAGTGCAGC 


1140 


5 


AATATAAATA 


TCTACATCTG 


GATGTGCTTC 


ATGCATCTTT 


TCTACG CCTT 


CTGGTGCTGC 


1200 




AATTAAACAC 


ATGAAGCGAA 


TATTTTTAGC 


GCCACGTTTC 


TTCAATGAAG 


TAATAGCTTC 


1260 




AATTGCTGAT 


GCGCCTGTTG 


CTAACATAGG 


ATCAAGAACA 


ATGATTTGTC 


TTTCAGTAAT 


1320 


10 


ATCTTGAGGT 


AACTTAGCAA AATACTCTAC 


AGCCTTTAAT 


GTTTCGGGAT 


CTCGATATAA 


1380 




AGCGATATGT 


CCAACTCTGG 


CTGCAGGTAC 


TAAAGTTAAA 


ATACCATCAG 


TCATACCTAA 


1440 


15 


AC CAGCTCTT 


AAAATTGGAA 


CGATAGCTAA 


TTTTTTACCA 


GCTAATCGTT 


TAGCCGTCAT 


1500 


TTTAGTTACA 


GGCGTTTCAA 


TATCAACATC 


CTGAAGCTCT 


AAGTCTCTAG 


TTACTTCATA 


1560 




TGCCATCAAC 


ATACCAACTT 


CGTCTACAAG 


TTCTCTAAAT 


TCTTTAGTAC 


CTGTATTTAC 


1620 


20 


ATCTCTAATA 


TAGCTTAGTT 


TGTGTTGAAT 


TAATGGATGA 


TCGAAAACGT 


GTACTTTACT 


1680 




CATAAAAATT 


ACTCCTATCT 


TTGTGTATGT 


TTATTGATAT 


AGAGGATATT 


CAGCTGTTAA 


1740 




TTTCGCAACG 


CGTTCTTTAG 


CTTGTTGTAA 


TTTTTCTTCA 


TCTTTACTAT 


TTTTCAATGC 


1800 


25 


TAAACTGATG 


ATTTTTGCAA 


CTTCCTCAAA 


AGCTTTTTCA 


TCAAATCCAC 


GCGTTGTTGC 


1860 




AGCAGGTGTA 


CCTAAACGTA 


TACCACTCGT 


TACAAAAGGT 


TTTTCTTGAT 


CGAACGGAAT 


1920 




GGTATTTTTG 


TTACATGTGA 


TACCAACTGA 


ATCTAAAGTC 


TCTTCAGCTT 


CTTTACCAGT 


19B0 


30 


AAGTCGTATA 


GACCCTTTTA 


CATCAACAGC 


TACTAAGTGA 


TTATCTGTAC 


CGCCAGAAAC 


2 04 0 




AATTCTAAAT 


CCTTCATTAA 


TTAATGCTTC 


TGCAAGAACT 


TTTGCGTTTT 


TAACCACTTG 


2100 




TTGTTGATAC 


GTTTTGAAAT 


TATTTTCTAA 


CGCTTCTCCA 


AAAGCAACTG 


CTTTtGCTgC 


2160 


35 


AATAACATGC 


TCAAGAGGTC 


CACCTTGAAT 


ACCAGGGAAA 


ATTGTTTTAT 


CTATGTCTTT 


2220 




TTTATATTCT 


TCCTTACATA 


AAATCATACC 


ACCACGtGGT 


CCGcGTAATG 


TTTTGTGTGT 


2280 


40 


TGTAGTTGTT 


ACAAAATCAG 


CATATTGTAC 


TGGATTTGGA 


TGTAAACCTG 


CCGCTACTAA 


2340 


TCCTG CAATA 


TGTG CCATGT 


CTACCATTAA 


CTTAGCGTTT 


ACTTCATCTG 


CGATTTCTTT 


2400 




AAACTTTTTG 


AAGTCAATTG 


TTCTTGAATA 


TGCTGATGCT 


CCTGCCACAA 


TAAGCTTAGG 


2460 


45 




AACGCTAATT 


TACGAACTTC 


ATfATAATTfS 
r\X v_r\ ± f\t\ X X o 


n X X *—vJ X X V_ X VJ 








TACTCCATAT 


TCAACGAAAT 


TGTAGAATTT 


ACCACTAAAA 


TTAACAGGCG 


CTCCATGTGT 


2580 




CAAGTGACCA 


CCATGACTCA 


AATTCATACC 


TAAAACTGTG 


TCGCCCATTT 


CTAATGCAAC 


2640 


50 


TAAGTAAACA 


GCCATGTTCG 


CTTGTGAACC 


TGAATGTGGT 


TGAACATTGA 


CATGTTCAGC 


2700 




TCCAAACAAT 


GCTTTAGCAC 


GATCAATTGC 


GATGCTTTCA 


GTAACATCTA 


CAAACTCACA 


2760 



55 
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TTGTGCTTCC ATAACCGCTT CCGATACAAA ATTTTCCGAT ■ GCGATTAACT CTATGTTGCT 
ATTTTGTCTC TGAAATTCTC TCTCGATTGC TTCTGCGATA ACTTTATCTT GCTTGGTGAT 
ATAAGACATA AAATCTCCCC TTCTTTCAAA AAAACTTATT GGTATTTAGC ACGTTCGCCA 
CCAATCTTTT TCGGCCTAGA TGTGGCAATA GTTACAATTG CCTGTCCTAC TTG CTTTACT 
GAGGTCCTTA CAGGTACACA TACATGTTTA ATATGCATGC CTATTAACGT TTGACCAATA 
TCAATTCCAC AAGGAACAGT AATATGTTCG ACCACGATCG GATCCTTCAT ATGCTGAAAA 
GCGTATGTTG CCAAACTCCC TCCAGCATGT ACATCTGGAA CGACGGAAAC TTCTTCCATT 
GTTAATGGAT TATACTGAGA TTTTTCTATT GTTATCGCTC TGTTGATATG TTCACATCCT 
TGAAAAGCAA AAGTAACGCC TGTCTCTTTA CTCACAACAT CTAATGCATT AAAAATAGTT 
TCTGCAACTT CCaTCGAACC GACAGTCCCT ATTTTTTCGC CAATGACTTC CGATGTTGAA 
CATCCAATTA AACATATATC TCCTTTATTA AAAAAGGACA TATCTTTTAA TTCGTCTAAT 
AACATTGTCA AATCTTTCAT AAAAGCCCAC CCTTCCTAAA AATAAAAAAG GAATATAGCA 
AAGTGCTACA CTCCTCTATT ATAACTT ATT TAACTGTTAA CAT ATACTAA TTATACAGAA 
TTCCTACTAG CAAATAATAT CTTTTAATTT TAAAATTAAA CTTACAAGTT CTTCATAGGT 
ATGTACATAC ATTTCTTTTG TTCCACCGTA TGGATCTATA ' ACTTCTCCTG CTTCTTTtAC 
ATATTCATGC AATGTGAAAA CATGATTTTG CAAACCAAAG TGTGCCTCTA TTAATTCTTT 
GTGCGAATAC GACATCGTCA AAATAATATC TGCTTTCAAA * TCTGCTTCAG : TAAATTGTTG 
CGATAAGGTC GTTTCAGCTA AATGATGTTC TTCAACTAAG TCTTCAACAT AATTCGAAAC 
ACCTTGATTG TTCACAGCGA ATATACCTCT TGATTCAAAT TGATGATTTG GCATAACCTC 
TTTTGCAATA CTTTCCGCTA ATGGGCTACG ACATGTGTTA : CCTGTACAAA CGAATAAAAT 
CTTCATAGTT CACATCCTTT AATAATGTGA TTACCTGCAG CTTTTAACAT GCGATTCATA 
ATTGCTTCTG TATTATCATT CAGCTCAAAG CCGTATATAT ACGCCGCTGA AATATTTTCA 
TTTTCATCAA GTGAATGTAA CACATCATAA AGATTATGAC TTGCTTGTTT AACATCATTG 
TCATCCTGAC ATAATTGAAT GAATTGCGCT TCACTTGGTA TAAACGCCAC CTTATTACTC 
GGCACAATAA AAGCTATAGA AGACCAATCT TTACCGTCAT TTCCAATTTT GCTCTCAATA 
TCTGTAATAA TTGTAAGTGG TGTATTGGGT GAGTAATGCT TATACTTCAT ACCTGGTGCA 
ATTGGCTGTT CAGTATCATT ATAATCAGCA TGGGCGATAC TATTCGGAAG TATTTCTGTA 
ATCATTGCTG CTGTTATAGA AC CAGGT CTT GCAATTTTAT AAGGAAAAGA TGTGCAATCT 
AAAACCGTAC TTTCTAATCC TTCTTCACTT TGTTCAGCTT GAACAAT AC C ATCGATACGG 
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GCACTTGGAG 


CAGCTAGAGG 


TTCATtTATG ATTTGTAATA ATTGTCTACC TACAGAATGG 


4680 




CTTGGCATTC 


TAACAGCAAC 


TGATGATAAA 


CCTCCAGAAA 


CTTTTCGACA 


TAGATAGCCT 


4740 


5 


AGCTTTAACG 


GCAATATAAA 


CGAAATAGGG 


CGCGGCCAGA 


ATGCGTGCAT 


TAACTTTTCT 


4800 




ACGCGTGGAT 


CCAAAGTATA 


TGTAAAATCT 


TTTAATTGAC 


CTTTACTGTG 


TATATGAACA 


4860 




ATAAGCGGAT 


TGTCAGATGG 


ACGGCCTTTA 


GCTTCATATA 


TTTTAGCTAC 


AGCTTCTTCA 


4920 


10 


TCTGTCGCAT 


TTGCTGCAAG 


TCCATAAACT 


GTTTCAGTTG 


GTAAACCTAT 


TAAACCACCG 


4980 




TTTAAAACAA 


TGTCTTTTAT 


TTCATTAATT 


TTAGGATATT 


GCTGTAAATC 


TTCATTATAT 


5040 


15 


TCTCTAACAT 


CCCAAATTTT 


AGTATCCAAC 


TTAATCACGC 


CTTTCTTATT 


TATCATAATA 


,5100 


TAAAGCAAAA 


AGCTATGCAC 


TTAACTAATC 


ATAGCAAAGG 


CATAACTTCT 


AATTACCATT 


5160 




TAAATGAGAC 


G ATTCGAT CG 


TGGCCATTTA 


TATCTTTAAT 


AATGTCGATT 


TTTTTGTCAG 


5220 


20 


GAAATTTATT 


TAAAATTATT 


GATTTAAGTG 


CCTCACCTTG 


ATTGTAACCA 


ATTTCAAAAA 


5280 


CAACTGGGCT 


occnrrrrcc 


ATAACGTGAG 


GTAAATCTTC 


AATGATTGAT 


TCATAAATAG 


5340 




CATATCCATG 


GTTATCTGCA 


AACAATGCCT 


GATGTGGTTC 


GAATCTCGTA 


ACCGTTGGAG 


5400 


25 


ACATCGTAAC 


CATATCTTTT 


TCATCTATAT 


ATGGTGGATT 


AGATATCAAG 


CCGTTCAACT 


5460 




TGATACCTTC 


ATTAATTAAG 


GGCTTTAATG 


CATCCCCTGT 


TAAAAATTGT 


ATTTGTGATT 


5520 




GATGCTTCTC 


AG CATT ATT A 


CGAGCCATAT 


TCATTG CTTG 


AAGTGAAATA 


TCAGTAGCAA 


5580 


30 


TAACATTTAA ATCCGGCTTT 


TCACATTTCA 


AAGTAATTGG 


AAGTACACCA 


CTACCCGTTC 


5640 




CGATATCTAC 


GATTGTTG CA 


T CAT C IT CTA 


ACTGTTGTAA 


GAAATGCAAC 


ATTACTTCTT 


5700 




CAGTTTGAGG TCTTGGTATC AAACAATTTG AGTTTACATC AAACGTTCTA CCATAAAATG 


5760 


35 


AGGCAAAGCC 


AACTATATAC 


TGTATAGGCT 


CTCCTAATAA 


CATACGTTGT 


AATGCTAAGT 


5820 




CGAACTTCAT 


AATCATCGCT 


TTCGGCATAT 


CATCATGCAT 


GTGGACTACA 


AAGTCCGTAC 


5880 




GCGTCCATTG 


AAATACATCT 


AACATTAACC 


ATTCAGCTCG 


TGTTTGTTCA 


AAC C CTTTTT 


5940 


40 


GTTGTGTTAA 


ATGAATTGCT 


TCAT CTAACT 


TTTCTTTATA 


ATTCACCATT 


ATTAAGTTCT 


6000 




TTCAATTTAT 


CTGTCTGCTC 


TGATAAAGTC 


AGTGCATCTA 


TAATTTCTTC 


TAAATGGCCT 


6060 


45 


TCCATAATTT 


GCCCTAATTT 


TTGAAGCGTT 


AGACCTATAC 


GATGGTCTGT 


TACACGGCTT 


6120 


TGTGGATAAT 


TATAAGTTCG 


AATACGTTCT 


GAACGATCAC 


CAGTACCGAC 


TGCTGATTTA 


6180 




CGTTGTGACG 


CATACTTTTG 


TTGTTCTTCT 


TGAACTTTCA 


TATCGTATAA 


ACGTGCTTTT 


6240 


50 


AACACTTTCA 


TTGCTTTTTC 


ACGGTTTTGA 


ATTTGAGACT 


TCTcAGAAGA 


TGTTGCAATG 


6300 




ACACCAGTTG 


GTAAATGGGT 


AATACGTACT 


GCAGAGTCAG 


TTGTGTTTAC 


GTGCTGACCA 


6360 
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ACATCTTCAA 


CTTCTGGTAA 


AACTGCCACT 


GTAGCTGTTG 


AAGTATGAAT 


ACGTCCACCT 


6480 




GATTCTGTTT 


CAGGCACACG 


TTGAACGCGG 


TGCGCACCAT 


TTTGAAATTT 


CAATTT ACT A 


6540 


5 


TACGCGCCAT 


TACCAGAAAC 


TGAGAAACTA 


ATTTCTTTGT 


AACCACCATG 


GTCACTTTCA 


6600 




GACG CTTCTA 


CTATTTCAGT 


TTTGAATCCT 


TGTGATTCAG 


CATACTTTGA ATACATACGC 


6660 




ATT AAATCAC 


CAGCAAAAAT 


CGGAGCCTCA 


TCACCACCTG 


CTGCTGCTCT 


TATTTCTACA 


672 0 


10 


AT AACGT CTT 


TGTCATCATT 


AGGATCTTTA 


GGAATCAATA ATATTTTAAG 


CTCTTCTTCA 


6780 




AGATTTGGAA 


GTTCAGCTTT 


AATACCATTA 


CTCTCCTCTT 


TTAACATTTC 


TACTTCTTCT 


6840 


15 


X X **x v»^rv x v«^Vsj 


TCTCACTTAA 


r , &T f PTi rv ri'r'& 


ATATCAGCTA ATTCTTCTTT 


TTTAGCTTTA 


6900 




AAACATCTAC 


AGTTTTTTGT 

**vj 4. ,1 X A X X vj X. 


AAATCAGCTT 


GCTCTTTAGA 


ATATTTACGT 


6960 






Aniwu X AAV 


AACATCTGGG 


TCACTTAACA 


GTTCATTTAA 


CTGTTCGTAT 


7020 


20 


UX ILIA 


Unn X X \— x Art. 


x x vxrv x v»nfttt\. 


ACTTATAATT 


CCTCCTTATT 


ATTATCACTA 


7080 




VjVv X\»U X AL. w*. 




uv.unwutL\j x 


GGCTCATAAC 


TTTCATTGGC 


ACCTACT AAG 


7X40 




AIAA1 


UnlUinll X X 


X \3\J X X X f\ 


CCATTTATTA 


ATCGTTGCGT 


TCTACTAGAT 


7200 


25 






A^VVv X O w X X \Xn 


AGTTTCGTTA 


CTTGTTCACT 


GACAGCCATC 


7260 




AAI x iAtA»(-A 


1 1 Vjvj 1 X 


crzrzTTHCzc'CC 

X X V-.vj\_, 


CTAAAATCCA 


TATCTAATCC 


AGGAACAATA 


7320 




«U-aV_V?v7 X\j X V— 


w\l v X VJv X 


TAfSTTTT^rfT 

X ^VJ XX X X , X W X 


ACTATACTTA 


CAATTTCATC 


GTCAAAAAAT 


7380 


30 




LXnX lUV,lnl 


A APATPAACA 


TTAGTTAAGT 


CGTGCGTCAT : AATTTCACTT 


'7440 




\a\- X X l/ujnnn 


TATTAATCGC 


TTCAATGGCA 


TTACCATTAT 


GAGAGACCAC 


TTTTTCTTTA 


7500 




TGATATCGAT 


CATCAATCGC 


CGGTTTAAAT 


ACAACGACTT 


TTTGTTTAGC 


GTATATACCC 


7560 


35 


CTTCTTAGAC 


GTCTTATTAG 


TTCTTCGGAT 


TTAC CGCTAA 


ACATACTACC 


TGTAAT ACAT 


7620 




TCTATCCAAC 


CGGAATGGTA 


AGTTTCATAC 


ATTGAGAGTn 


CCACCTTTTT 


CAAAACATAA 


7680 


40 


TCGCTTTATT 


ATATCATATT 


TCAAATATTC 


ATAAATGTCT 


TTnTCATAAT 


TATATCGATA 


7740 


TTGTACATGA 


ACAATTATTT 


TA 








7762 




(2) INFORMATION FOR SEQ ID NO: 125: 









<i) SEQUENCE CHARACTERISTICS: 

(A> LENGTH: 2583 base pairs 

(B) TYPE; nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



so 

(xi) SEQUENCE DESCRIPTION : . SEQ ID NO: 125: 
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10 



is 



20 



25 



30 



35 



45 



TAAAAAAATT 


ATTATCAATG 


ATGAACTAGA 


ATTGACTGAA TTCCACCAAG 


AACTTACTTA 


120 


TATTTTAGAC 


AACATAnAAG 


GGAATAATAA 


TTATGGTAAG 


GAATTTGTTG 


CAACCGTTGA 


180 


AGAAACATTC 


GACATTGAAT AaAGCGGGGT GgaAGCACTA TGAATCAATG GGATCAGTTC 


240 


TTAACACCTT 


ATAAGCAAGC 


GGTTGATGAG 


TTGAAAGkGA 


AcTTaAAGGC 


ATGCGCAAAC 


300 


AATATGAAGT 


TGGTGAACAA 


GCGTCGCCAA 


TAGAATTTGT 


TACTGGTCGT 


GTTAAACCAA 


360 


TCGCTAGTAT 


TATAGATAAG 


GCAAACAAAC 


GACAAATACC 


ATTTGATAGG 


TTAAGAGAAG 


420 


AAATGTACGA 


TATCGCTGGT 


TTAAGAATGA 


TGTGCCAATT 


TGTTGAAGAT 


ATTGATGTTG 


480 


TCGTCAATAT 


TTTAAGACAA 


AGAmAAGATT TTAAAGTAAT 


TGAAGAACGA 


GATTATATTC 


540 


GTAACACTAA 


AGAAAGTGGT 


TACCGCTCGT 


ATCATGTCAT 


TATTGAATAT 


CCAATTGAAA 


600 


CATTACAAGG 


CCAAAAATTT 


ATATTGGCTG 


AGATTCAGAT 


TCGTACATTA 


GCAATGAATT 


660 


TCTGGGCAAC 


GATTGAACAT 


AGTTTACGAT 


ATAAATATGA 


TGGTGCTTAT 


CCGGATGAAA 


720 


TTCAACATCG 


TTTGGAAAGA 


GCGGCAGAAG 


CAGCGTATTT 


ACTTGATGAA 


GAGATGTCTG 


780 


AAATTAAAGA 


TGAAATTCAG 


GAAGCTCAAA 


AATATTACAC 


GCAAAAACGT 


TCTAAAAAAC 


840 


ATGAAAATGA 


TTAACGAGGT 


GTTATAAATC 


ATGCGTTATA 


CAATTTTAAC 


TAAAGGTGAC 


900 


TCCAAGTCTA 


ATGCCTTAAA 


GCATAAAATG 


ATGAACTATA 


TGAAAGrTTT 


TcGCATGaTT 


960 


GaGGATrGTG 


AAAaTCCTGA 


AATTGTTATT 


yCAGTTGGTG GTGACGGTAC ATTACTACAA 


1020 


GCATTCCATC 


AGTATAGCCA 


CATGTTATCA 


AAAGTGGCAT 


TTGTTGGAGT 


TCATACAGGT 


1080 


CATTTAGGAT 


TTTATGCGGA 


TTGGTTACCT 


CATGAAGTTG 


AAAAATTAAT 


CATCGAAATT 


1140 


AATAATTCAG 


AGTTTCAGGT 


CATTGAATAT 


. CCATTGCTTG 


AAATTATTAT 


GAGATACAAC 


1200 


GACAACGGCT 


ATGAAACAAG 


GTATTTAGCA 


TTAAATGAAG 


CAACGATGAA 


AACTGAAAAT 


1260 


GGCTCAACAC 


TTGTTGTGGA 


TGTTAACTTA 


AGAGGGAAAC 


ACTTTGAGCG 


ATTTAGAGGC 


1320 


GATGGATTAT 


GTGTATCAAC 


ACCTTCGGGT 


TCAACGGCTT 


ATAACAAAGC 


GCTAGGTGGC 


1380 


GCACTGATAC 


ATCCTTCACT 


TGAAGCAATG 


CAAATTACAG 


AAATTGCCTC 


GATAAATAAT 


1440 


CGTGTGTTTA 


GAACGGTAGG 


ATCACCACTT 


GTATTACCAA 


AGCATCATAC 


ATGTTTAATA 


1500 


TCACCAGTTA 


ATCATGATAC 


CATTAGAATG 


ACGATAGATC 


ATGTTAGTAT 


CAAACATAAA 


iccn 
IjDU 


AATGTTAATT 


CAATACAATA 


CCGTGTAGCA 


AATGAAAAAG 


TGAGGTTTGG 


ACGTTTTAGA 


1620 


CCATTCCCAT 


TCTGGAAACG 


TGTGCACGAT 


TCTTTCATAT CAAGTGATGA 


AGAACGATGA 


1680 


AATTTAAGTA 


TCATATATCA 


CAACAAGAAA 


CTGTTAAAAC 


TTTTTTAGCA 


CGACATGATT 


1740 


TTTCTAAGAA 


GACAGTGAGC 


GCCATTAAAA 


ATAATGGCGC 


TTTAATTGTT 


AATGATGAAC 


1800 
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AAATACCGAG 




ATACCTTATG CTCGTAAGCT 


AGAAGTATTG 


TATG AAGATG 


fTTTTA Tf^ A*F 


CATAf3TTAPT 


AAACCAAACA ATCAAAATTG 


TACGGCTTCG AGAGAACATC 


CTCATGAAAG 


X X XrV^tX VvWn^k 


CAAGTACTAT ATCATTGTCA 


GGAACATGGT 


GAAAATATTA 


APCY'APATAT 


TGTTACG CGT 


CTAGATCGTA ATACAACTGG TATTGTGATA TTCGCTAAAT 


ATraiAfATAT 


CPATCATTTA 

*w\_nX X X xn 


TTTTCTAAAG TAAACTTGAA 


AAAAATATAT 


ACTTGCCTTG 






TCTGGTATTA TTGAAGCTAA 


TATTAGACGG 


TCAAAGGATA 






GCCTCGGATG GTAAATACGC 


TAAAACATCT 


TATGAAGTAA 


TAAATCAGAA 


TGATAAATAC 


AGTTTATGCA AAGTTCATTT 


GCATACGGGA 


CGTACACATC 


AAATTCGTGT 


ACATTTTCAA 


CATATTGGGC ATCCAATTGT 


GGGAGATTCT 


TTGTATGATG 


GTTTTCATGA 


CAAAATTCAT 


GGTCAAGTAC TGCAATGTAC 


GCAAATATAT 


TTTGTTCATC 


CAATCAATAA 


GAACAATATT 


TATATTACAA TTGATTATAA 


GCAATTACTT 


AAATTATnCA 


ATCAACTCTA 


ATnCACACAG 


GGGGTGTAAG TATGTCAATG 


AnCACAGATG 


AAAAAGAGCG 



TGT 

(2) INFORMATION FOR SEQ ID NO; 126: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1818 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND ED NESS : double 
<D) TOPOLOGY : linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 126: 
ATCAAGTGAT ACATTTAACT GGTAAAGGAT TAAnAGATGC TCAAGTTAAA AAATCnGGAT 
ATATACAATA TGAATTTGTT AAAGAGGATT TnACAGATTT ATTnGCAATT ACGGATACAG 
TAATAAGTAG AGCTGGATCA AATGCGATTT ATGAGTTCTT AACATTACGT ATACCAATGT 
TATTAGTACC ATTAGGTTTA GATCAATCCC GAGGCGACCA AATTGACAAT GCAAATCATT 
TTGCTGATAA AGGATATGCT AAAGCGATTG ATGAAGAACA ATT AACAG CA CAAATTTTAT 
TACAAGAACT AAATGAAATG GAACAGGAAA GAACTCGAAT TATCAATAAT ATGAAATCGT 
ATGAACAAAG TTATACGAAA GAAGCTTTAT TTGATAAGAT GATTAAAGAC GCATTGAATT 
AATGGGGGGT AATGCTTTAT GAGTCAATGG AAACGTATCT CTTTGCTCAT CGTTTTTACA 
TTGGTTTTTG GAATTATCGC GTTTTTCCAC GAATCAAGAC TTGGGAAATG GATTGATAAT 
GAAGTTTATG AGTTTGTATA TTCATCAGAG AG CTTT ATT A CGACATCTAT CATGCTTGGG 
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5 



10 



15 



20 



35 



CTCATGTTAA 


AGCGCCACAA 


AATTGAAGCA 


TTATTTTTTG 


CATTAACAAT 


GGCATTATCT 


720 


GGAATTTTGA 


ATCCAGCATT 


AAAAAATATA 


TTCGATAGAG 


AAAGACCTAC 


ATTGCTGCGT 


780 


TTAATTGATA 


TAACAGGATT 


TAGTTTTCCT 


AGCGGTCATG 


CTATGGGATC 


AACTGCATAT 


840 


TTTGGAAGTG 


GTATCTATCT 


ATTAAATCGA 


TTAAATCAAG 


GTAATTCAAA 


AGGTATTCTT 


900 


ATAGGGTTAT 


GTGCAGCTAT 


GATTTTATTG 


ATTTCCATAT 


CACGTGTATA 


TCTAGGTGTA 


960 


CATTATCCAA 


CAGATATTAT 


TGCCGGCATT 


ATTGGTGGAT 


TATTTTGcAT 


TATTTTATCA 


1020 


ACGTTATTAC 


TTAGAAATAA 


ATTAATAAAT 


TAAATAGTAA 


AAAAACAAAA 


GCAGTAAACC 


1080 


TAAAGTGTCG 


TAAGGGTTTA 


CTGCTTTTAT 


AAAACGTTGT 


TATAACGTAT 


ATTGTCTTTT 


114 0 


ACGGGCATAT 


AAnAGGGGAA 


TATTTGAnAA 


TGACCAATCC 


AACAAGAACG 


AAACGTTGTG 


1200 


GGGGGGATGT 


TCTATGTGGT 


ATTGATAATC 


ATTTTCAACT 


ACTATTATAC 


ATTAGTGAGA 


1260 




ATTAGAAACT 


AAAACTTTTT 


TTGAATATTT 


TTTAAGAATA 


GTAAATAAAA 


1320 


CGCATGATTA 


CGCTATTTTA 


GAAAATAAAA 


AAATTTGTAT 


TTCTCATTAG 


AATTAGAATA 


1380 




ATGAGGTTTA 


AACATTATAT 


TGTTTACATA 


CTCCTTTTGA ATTCATACAT 


1440 


TATPIAAATHT 


tACTTCCAAG 


TTCAAAATCG 


CACATTGAAA 


TGATGTGTGA 


AATGTTTAAA 


1500 


CTACGGTCAT 


t TTGTGmAAA 


TAAAGrTAAT 


AACTATTCAT 


TTTACAATAG 


TGAAAAGTCA 


1560 


GTATATGACA 


ACAATTAATA 


TTGCGGTAAG 


GCCTTGTGTT 


ACAGTATTCT 


ATATTTAAGT 


1620 


ACTG CAATCA 


GAATTAACAG 


AATGCCATTA 


ACTGATTATT 


AAATATTTGA 


GTTAATAAAT 


1680 


AATTAATGAT 


TGTAGCTTGA 


AAAATTTAAA 


ACATGGTTAT 


TGATTTGTGA 


TAAAATTTAA 


1740 


ACGTAAACAA 


ACTAATTTAA 


AAAGCAACTA 


TTGTATAGAA 


AAATACAAAA 


TTTAAAATAT 


1800 


ATTACCTTAT 


TAGAAAAA 










1818 



(2) INFORMATION FOR SEQ ID NO: 127: 



(X) SEQUENCE CHARACTERISTICS: 
40 (A) LENGTH: 12658 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

45 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 127: 
TGTTTAAACA ATAGGGGGAA TCTTATGATT GAAAAATTAG TAACCTTTTT AAATGAGGTT 60 
60 GTTTGGAGTA AGCCATTAGT TTATGGTTTG CTAATTACTG GTGTGCTATT TACATTGCGT 120 

ATgCGATTTT TTCAAGTTAG ACATTTTAAA GAAATGATTC GATTAATGTT TCAAGGAGAG 180 
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GGTACAGGTA ATATTGTCGG TGTATCTACT 


GCAATATTTA TAGGAGGAGC 


TGGTGCAGTA 


300 




TTTTGGATGT GGATTACTGC GTTTTTAGGT GCAAGTAGTG CTTTTATTGA ATCTACACTT 


360 


5 


GGTCAAATAT 


TCAAGAGAGT TGAAAATAAT 


GAATACCGTG 


GTGGACGAGC 


GTATTATATT 


420 




GAATATGGTA TTGGTGGTAA ATTTGGTAAA ATTTACGGAA 


TTATCTTTGC 


TATTGTTACG 


4 80 


10 


ATTATCTCAG 


TAGGTCTATT GCTTCCTGGT 


GTGCAATCTA ACGCTATAGC AAGTTCTATG 


54 0 


CATAATGCGA TTCATGTTCC ACAATGGTTA ATGGGTGGTA 


TTGTTGTAGT 


TATTTTGGGA 


600 




TTAATTATTT 


TTGGTGGTGT ACGTATTATT 


GCCAATGTTG 


CAACAGCCGT 


TGTACCATTT 


660 


15 


ATGGCAATTA 


TTTACATACT GATGGCTGTC ATTATCATTT GTATCAATAT ACAAGAAGTG 


720 


CCAGCGTTAT 


TTGCATTAAT TTTCAAATCA 


GCATTTGGAT 


TACAATCTGC 


TTTTGGTGGT 


7B0 




ATCGTTGGCG 


CAATGATAGA GATTGGTGTT 


AAACGTGGAT - 


TATATTCAAA 


TGAGGCTGGT 


640 


20 


CAAGGTACAG 


GTCCACACGC AGCAGCGGCa , 


gcAGaAGTAT 


CACATC CAAG 


TAAACAAGGT 


900 




CTAGTACAAG 


CATTTTCAGT TTATATTGAT 


ACATTATTTG 


TATGTACTGC 


AACTGCTCTG 


960 




ATT AT ACTT A 


TTTCTGGTAC ATATAATGTG 


ACTGATGGTA CGGTTAATGC 


GAATGGCACA 


1020 


25 


CCGCATTTAA 


TTAAAGATGG CGGTATTTAT 


GTTgAAAATG 


CAACAGGTAA AG ATT ATT CA 


1080 




GGTACTGCGA 


TGTATGCACA AGCCGGCATt 


GATAAAGCGT 


TCCATGGCAG 


TGGTTATCAA 


1140 




TTTGAT CCTA CTTTCTCTGG CGTAGgTTCG 


TACTTTATTG 


CATTTGCTTT 


ATTCTTCTTT 


1200 


30 


GCATTTACTA 


CAATTTTGTC GTACTACTAC 


ATTACAGAAA 


CAAATGTTGC 


TTATTTAACG 


1260 




CGTAATCAAA 


ATAATCAAGT TTCATCGATA 


TTTATTAATA 


TTGCTCGTGT 


GATTATTTTG 


1320 




TTCGCTACAT 


TTTACGGTGC AGTTAAAACA 


GCTGATGTAG 


CATGGGCATT 


CGGTGATTTA 


1380 


35 


GGTGTAGGTC 


TAATGGCTTG GTTAAATATC 


ATTGCGATTT 


GGATTTTACA 


TAAGCCTGCC 


1440 




GTAAATGCTT 


TAAAAGATTA TGAAATTCAA 


AAGAAACGTT 


TAGGCAACGG 


TTATAATGCA 


1500 


40 


GTTTATCAAC 


CTGATCCGAA TAAATTACCT 


AATGCTGTCT 


TTTGGTTGAA 


GACGTATCCA 


1560 


GAACGTTTAA 


AACAAGCACG TGCCAAAAAG 


TAATCTACTT 


TTGTTTATAG 


TATATGTAGT 


1620 




GATCATTTGA 


TAAAAAAGAA AAGTATTGAG 


AATTTTAGGt 


GCTCAGAAAT 


TTGAATTTTA 


1680 


45 


AAAATATAGT 


GTCTCTTGGT ACAATAACAA TACAACTACT AGGGGCACTT TTTTATGTCA 


1740 




GAATTTAAAA 


CTGGTAAG AT TAATAAACAT 


GTTTTATATA 


GTAATATTTT 


AAATAGAGAT 


1800 




GTCACGTTAA 


GTATTTATTT ACCAGAATCT 


TATAATCAAC 


TTGTTAAATA 


TAATGTCATT 


1860 


SO 


CTTTGCTTTG 


ACGGATTAGA TTTTTTACGT 


TTCGGGAGAA 


TACAACGTAC 


ATATGAATCG 


1920 




TTAATCAAAG 


AAGCGCGTAT TGATGATGCG 


ATCATTGTTG 


GATTCCATTA 


TGAAGACGTT 


19B0 
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GTCGGTAAAG AAATATTGCC ATTTATTGAC 
GCAAGGTTAT TAGTAGGGGA TAGTTTAGOG 
5 TATCCAACGA TTTTTAGTCG TGTAGCAATG 

GATAAGCTAA ATCAATGTGC AAATAAAGAA 
GATGAAAAAG ATTTTACTTT ACCAACAAAT 

10 

AGAGAATTAG CTGAACAAAT TAAGAAATAT 
GGTGGTCACC AATGGAAAGA TTGGAAACCA 
AGTAAAAACA CAGATGATCA ACTTTATGAA 

1$ 

GTCTTCATAT AGTCTGGTCT ATAATATAAT 
TAAATTTGAC GAAATTGCAA AAGATGTATA 
AGAAATTTGA TATAATAGCA ATAGGTTAAA 

20 

AGCATTAATT CCATCAAAGT CATTTCAAGA 
TAAACAGTAT TCACGAATTA AACCACATGT 

2s TGGTGATTTA GATTCTGTCA TTGAACAGGT 

AGAAGTTCAT GCTACAAAAG CTTCTAGCTT 
AGTTGCGAAG ACGGACGACT TAGAAGAATT 

30 TGGAGAAGCT GAACATGTTT TTGTGCCACA 

AGAATTCGAA GATATTTTTG GTCaAGTAGC 
CGATGAATTA ACTTTGTTAC GTTTTGACGA 

35 GTTTAAATTA GCTTAAGTAA CATAATAGTA 

GAAAATGGTC ATTTTTATTG AATGTAATAA 
TTTTAACCTT ACTTAGCTTT TTCTCTATTT 

40 

AAGACTAAAA AG ATTAATG C CGAGAAATAA 
GTAATTAATC CGCCAAATAA TGGCCCTATC 
ACACCCCAAG TTTCTTCTTG TTCATCTGAT 

45 

GCTGGTAATA AGATGCCATA CATTAGACCG 
ATATTAACAA TCATAGATAG AGTAAAAATT 
5Q ATAACACCAT ACATAAAGTT TCTGCTG CGG 
GAAACTGCAC AGCCGATACC ACCAATAATG 



TCGACGTTTT CTACACTGAA AGTAGGTAAT 2100 

GGTAGTATTG CCTTATTAAC GGCGTTGACC 2160 

TTAAGTCCAC ATTCAGATGA AAAAGTATTA 2220 

CAATTGACAA TTTGGCATGT CATTGGTCTA 22 BO 

GGTAAGCGTG COGATTTCTT AACACCGAAT 234 0 

AATATAACTT ATTATTACGA TGAATTTGAT 2400 

TTGCTGTCAG ATATATTATT GTATTTTTTA 2460 

TAATTTACAT TAGTAGATTT AGTATGAATT 2520 

TTATAAAAGA TTTTACTGTT TAATTTAATT 2580 

ATGAATTATT TTTAATGTAA CGGTTTTCAA 2640 

CAAAGGAGGA ATTCAGATGA TTTTAGGATT 2700 

AGCGGTGGAT TCTTACCGTA AAAGATATGA 2760 

GACAATTAAA GCGCCATTTG AAATTAAAGA 2 820 

TAGAGCTCGT ATTAATGGTA TACCAGCAGT 2 880 

CAAACCAACG AACAATGTGA TTTACTTTAA 2 94 0 

GTTTAATCGC TTTAATGGAG AAGATTTCTA 3 000 

CTTTACAATA GCACAAGGAC TATCTAGCCA 3 060 

ATTAGCTGGG GTAGACCaTA AAGAAATTAT 3120 

TGACGAAGAT AAATGGAAAG TTATTGAAAC 3180 

TTGTTAATCG TAGTATGTTT GAATTAATAA 324 0 

AAATGACCAT TTTCTTTATT TTAAAATACG 3300 

ACTATAAAGT rGCTTCCATA AAATACAGCT 3360 

AATGTATTGT TTAAATTGTT GGTAAATTGT 3420 

ATTGAGCCGA ATCCTTGGAT ACTATTAAAA 34 80 

TTGATAAATC GTGCCATAAA GGTATTCCAT 3540 

ATAGCTAAAG CGATAATCCA CAAGATGTGA 3600 

AATATCATGT ATAAAATAAA TCCGCTTAGA 3660 

TTATCTATTA GTTTCGATAA AAATAGCATC 3720 

ATTGCAACAG TATATTCAAT TGTGCTTACG 3780 
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10 



1$ 



20 



25 



35 



40 



45 



50 



TGTAAAAGAA 
AATTGAGCTT 
AATATCCATG 
TTGATAAGTA 
ACATAGCCCA 
ATAGGACTAA 
GGAAACCAAA 
ATTTTTGTGC 
ATAAAATGTA 
AAGAAATTAA 
ATAAGCaTTA 
TAAAGGAACC 
GTCTCGACAT 
GTTAGTTAAT 
AGTATCAGCG 
ACCAGGTGCA 
GAT AC CAC CA 
GGTATAACCT 
TAG CT CTTTG 
ATCAGTAATC 
AGTTTGCTTA 
TTCAAATTTG 
GTCTATGAAG 
AATCCAGTTT 
AAATTGCTCA 
CTTTTCTTTT 
GTCTAGTTTA 
GCTATTGATA 
ATCGTGCTCA 



TACCAGGGAA 
TAACTGGACG 
CAATTAAAAC 
GATTCATAAA 
TTTGTTTGCC 
CTGCAATACC 
TAACTAAAAA 
CGAATTTTTT 
TTGAAAATGC 
TATAGCTTAG 
AAATGAAATT 
TTT CCATAAA 
ATTGTGTGTG 
TGCTCATTAC 
ATTTTACCAA 
GGATTTAGGA 
GGTTT CGTAA 
AGAATCAATA 
CTCTTACCAC 
ATCGTGTCAA 
TCTGGATCTA 
TTATCAATAG 
TCTTGTTTCG 
TTATGTAAGC 
GTTAGTACCG 
ATCAATAAAT 
TCTGGGCGGC 
TACCATTTTT 
ATGACGCTTA 



CaACAATAAA 
AGTATTATAA 
GACTAAAGAC 
AACCATACCT 
ACGTTTATCT. 
GAGCATCATA 
TAAACTTGTA 
CAGTAAAAAT 
TAGAGACGTT 
GATATACATG 
TTTATGATTA 
TCTCTTGTGG 
TAGCATACTT 
CGTTAGTTAA 
AACCTTTTTC 
AAATCATTGG 
TCATAAGTTG 
CATTCTCGTT 
AAATCATAAC 
AACCTTTAGA 
AGTTGTTGTC 
GAATAC CTGT 
TTTCTTTTGT 
GATAGTCTGT* 
ACATAACTGG 
TAATTAACTT 
TGTAATAAAA 
TACAAATAGA 
AATGGTCTAG 



TGGcGCTTTG 
TTTGTTAACT 
ATCATGAAGG 
ACCAATAGGC 
TCTTCAACAC 
GCACTAAATA 
AATGCTAAAA 
CCTATAACAA 
ATTGCTACAG 
CCTCTCGCAA 
GCGTAATTAT 
TTGTGATGAA 
AATTTTATCT 
ACTTGCTACA 
TTCAAAGTAA 
AATACAACGG 
ACTTGATGCC 
AGATTTAAAC 
TACTTGTGCA 
TACAC CAAAT 
TATTAACCAC 
CaCTTTAACT 
TGCCACATAA 
CATCACTGTA 
TGTAGGAAAC 
ATTAAGTCCA 
CCCTTTGTAC 
AGTCAAAATT 
ATTCATATCA 



TCACATCAAC 
TTACATCGAC 
CAAAGCGTGT 
CTAACAACCA 
TGGATAACAT 
TGATTACAAA 
TAAATCCAGT 
AGTTTGTAGA 
CAATGGATGT 
ATTCCATT AA 
TTAACGAAGA 
TGACCGATTA 
TGTTCCATTG 
ATTTTTATTG 
AGGGCATTTT 
GCGAAACCTT 
ATCCATTCAT 
TTAGCTGTTA 
TTTGCaCTTT 
GCACCAGCTG 
TGCTTTTGAT 
GTTGAAGGAT 
TATCTTGTTG 
GCAACTGGAA 
GTTAATAATA 
TAGTATTTGT 
ATATTTCTAA 
GGATGAGCTT 
TTAAGTTGAT 



AATTTGTCTC 
AAAATAATAT 
TGGGTGCACT 
TGAAAAATAA 
AATGACCCAA 
AGGTGATGCT 
CGTTAAAACG 
TGCATCAGCA 
AACTGTTGGC 
AAATAAGATA 
ATCTTGCATA 
AATCAAGTAA 
TACTAATCAT 
CTTCTTCTGG 
CAAGCTCTTG 
CAGTTATTGT 
TCATGTGTTT 
AAGAACGCTT 
tOGCTAATAT 
aCATTAAAAT 
TAATAGGCGT 
CAATACCTAC 
AATACGGCGT 
TATTAATGTT 
TTAAATCTGG 
AAAAACATTT 
AATATTTAAA 
CCATAAATAA 
TAACGATACT 



3900 

3960 

4020 

4030 

4140 

4200 

4260 

4320 

4380 

4440 

4500 

4560. 

4620 

4680 

4740 

4800 

4860 

4920 

4980 

5040 

5100 

5160 

5220 

5280 

5340 

5400 

5460 

5520 

5580 
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TTGAGTAACC ATTAATAGCC ACCCTCCGTT 
TTTTACGGCA TTATAAAAGA AATAAAGACG 
5 CTATAGATGA ATTGATACAA AATAAAACGT 

TTTATTTGTA TATTTAAAAT TATCCAGTAT 

TGATATTATA CCATGTTACA AGATGGTTTT 

10 

CTAATTCATA ATACCGTATG TTTTATTTTT 

AGGATATAAC AGTGAAATTA TAAATTTATT 

TTGTAGAAAA AGGAGCGGTT CAGTTTGGAT 

AAGCGTGTAT TGGGTTCTTT AGAACAACAA 

GCGAGAGAAG GTAGCATTTT TGTCGCTTCA 

TGTCAAAATG TAGCTGATCA AGGGTGTAAG 

20 

CCAGCTAACG TAACACAAGT GGTTGTGCCG 
CACACATTAT ATGATTATCC GAGT CATCAG 

25 GGTAAAACTT CTATTGCGAC GATGATTCAT 

GCATATTTAG GAACTAATGG TTT CCAAATT 
ACAC CAG AAA CAGTTTCTTT AACTAAGAAA 

30 TCTATGACAT TAGAAGTATC AAGCCATGGC 

TTTGACGTTG CAATATTTTC AAATTTAACA 
G AAG CAT ACG GACACGCGAA GTCTTTATTG 

35 GAAAAGTATG TCGTGTTAAA CAATGACGAT 

CCTTATGAAG TATTTAGTTA TGGAATTGAT 

CAAGAATCTT TACAAGG TGT CAGCTTTGAT 

40 

AAATCG CCTT ATGTTGGTAA GTTTAATATT 

TGGAGTAAAG GTACATCTTT AGAAACGATT 

GAAGGGCGAT TAGAAGTTTT AGATCCTTCG 

45 

CATACAGCTG ATGGTATGAA CAAATTAATC 
TTGATATTTT TAGTTGGTAT GGCAGGCGAA 
$0 CGAGTTGCCT GTCGTGCAGA TTATGTCATT 

CCGAAAATGT TAACGGCAGA ATTAGCCAAA 



AGTTTGAAAA TTTTATTTAA GTGTAACTTA 5700 

CAAAGTCGTT ACATTTATAG CAATTTTAAT 5760 

TATTTTATAA AGCAATTTAT TGTTCTATGT 5820 

ACAATTATAG CATATTTTTG GAAACAATTA 5880 

AATAATTTAA GATGAGCCAT AATTGTAAAA 5940 

AATAGTAGAA ATTAGAAAAT GCTGATTAGT 6000 

AACATCAACA AAACGTGTAT AATAAACATA 6060 

GCAAGTACGT TGTTTAAGAA AGTAAAAGTA 6120 

ATAGATGATA TCACTACTGA TTCACGTACA 6180 

GTTGGATATA CTGTAGACAG TCATAAGTTC 6240 

TTGGTAGTGG TCAATAAAGA ACAATCATTA 6300 

GACACATTAA GAGTAGCTAG TATTCTAGCA 6360 

TTAGTGACAT TTGGTGTAaC GGGTACAAAT 6420 

TTAATTCAAA GAAAGTTACA AAAAAATAGT 64 80 

AATGAAACAA AGACAAAAGG TGCAAATACG 654 0 

ATTAAAGAAG CAGTTGATGC AGGCGCTGAA 6600 

TTAGTATTAG GACGACTGCG AGG CGTTGAA 6660 

CAAGACCATT TAG ATTTT CA TGGCACAATG 6720 

TTTAGTCAAT TAGGTGAAGA TTTGTCGAAA 6780 

TCATTTTCTG AGTATTTAAG AACAGTGACG 6840 

GAGGAAGCCC AATTTATGGC TAAAAATATT 6900 

TTTGTAACGC CTTTTGGAAC TTACCCAGTA 6960 

TCTAATATTA TGGCGGCAAT GATTGCGGTG 7020 

ATTAAAGCTG TTGAAAATTT AGAACCTGTT 7080 

TTACCTATTG ATTTAATTAT CGATTATGCA 7140 

GATGCAGTAC AG CCTTTTGT AAAGCAAAAG 7200 

CGTGATTTAA CTAAAACGCC TGAAATGGGG 7260 

TTCACACCGG ATAATCCGGC AAATGATGAC 73 20 

GGTGCAACAC ATCAAAACTA TATTGAATTT 73 80 
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GTTTTAGCAT 


CAAAAGGAAG 


AGAACCATAT CAAATCATGC 


CAGGG CAT AT 


TAAGGTGCCA.' 


7500 ' 




CATCGAGATG 


ATTTAATTGG 


CCTTGAAGCA GCTTACAAAA AGTTCGGTGG TGGCCCTGTT 


7560 


c 
o 


GATTAATAAA 


AGATTTATTG 


ATGAAGGTAA AACTATTGAT. 


GTTTATTTAT 


TCGAAGCATT 


7S20 




AAATAACCAG 


ATAATCATTG 


CTATACCAGA TTGGTTTTGG 


TCATATCAGA 


TGGCAATGAC 


7680 




ATTAGATGAA 


GAAACTTGTT 


TTGAAGCAAT ACTCATGCAA 


TTGTTTGTTT 


TTAAAGAAGA 


774 0 


10 


GGAAGAGGCA GAATCGATTG 


CATCACAACT AACAGATTGG 


ATAGAAACAT 


ATAAAAAGGA 


7800 




GAAAGACTAA 


TGAACTTAAA GCAAGAAGTT GAGTCTAGAA AGACTTTTGC 


GATTATTTCA 


7860 




CATCCCGATG 


CAGGGAAAAC 


AACGTTAACT GAAAAACTAT 


TGTACTTCAG 


TGGTGCTATT 


7920 


15 


CGTGAAGCGG 


GTACAGTTAA AGGGAAGAAG ACTGGTAAAT TTGCGACAAG 


TGACTGGATG 


7980 




AAAGTTGAAC 


AAGAGCGTGG 


TATTT CTGT A ACTAGTTC-Av? 


TAATGCAATT 


TGATTACGAT 


8040 


20 


GATTATAAAA 


TCAATATCTT 


AGATACACCA GGACAI\iA/vj 


ACTTTTCAGA 


AGATACGTAT 


ni nn 

OIUU 


AGAACATTAA TGGCAGTTGA 




ACTGTGCAAA 


AGGTATTGAA 


OlDU 




CCACAAACAT 


TGAAGTTATT 


TAAAv* 1 1 lVj 1 AAAA1 Vtv-Iv X\j 


GTATTCCAAT 


CTTTACATTC 


a o o n 


25 


ATTAATAAAT 


TAGACCGAGT 


TV P^TK TV TV/"»7A A 0/*»Jl' 1*T*TY1A 3fc*P 


TATTAGATGA 


AATCGAAGAG 


0 u 




ACATTAAATA 


TTGAAACATA 




GTATGGGACA 


AAGTTTCTTT 






GGCAT CATTG 


ATAGAAAGTC 


TAAAACAATT GAACCATTTA 


GAGATGAAGA 


AAATATATTA 


Q A f\ f\ 


30 


CATTTGAATG 


ATGATTTTGA 


GTTGGAAGAA GATCATGCAA 


TTACAAATGA 


TAGTGATTTT 






GAACAAGCGA 


TTGAAGAATT 


AATGTTGGTT GAAGAAGCGG 


GTGAAGCCTT 


TGATAATGAC 






GCGCTGTTGA 


GTGGAGACTT 


AACACCTGTA TTTTTCGGTT 


CAGCTTTAGC 


TAACTTTGGT 


Dean 

O ? O VJ 


35 


GTACAAAATT 


TCTTAAATGC 


ATATGTTGAT TTTGCGCCAA 


TGCCAAATGC 


GAGACAAACA 


8640 




AAAG&AGACG TTGAAGTAAG 


CCCGTTTGAT GATTCATTTT 


CAGGATTTAT 


CTTTAAAATT 


8700 




CAAGCCAACA 


TGGACCCTAA 


ACACCGTGAT AGAATTGCCT 


TTATGCGTGT 


CGTTAGTGGT 


8760 


40 


GCATTTGAAC 


GTGGTATGGA 


TGTTACTTTG CAACGTACTA 


ATAAAAAGCA AAAGATCACA 


8820 




CGTTCAACGT 


CATTTATGGC 


AGACGATAAA GAAACTGTGA 


ATCATGCTGT 


AGCAGGCGAT 


8880 


45 


ATCATTGGAC 


TATATGATAC 


TGGTAATTAT CAAATTGGAG 


ATACTTTAGT 


TGGTGGAAAA 


8940 


CAAACCTACA 


GTTTCCAAGA 


TTTACCACAA TTTACGCCAG 


AAATTTTTAT 


GAAAGTTTCT 


9000 




GCTAAAAACG 


TCATGAAACA 


GAAGCATTTC CATAAAGGTA 


TTGAACAATT 


AGTACAAGAA 


9060 


50 


GGTGCGATTC 


AATACTATAA 


AACATTACAC ACAAACCAAA 


TTATTTTAGG 


TGCTGTTGGT 


9120 


CAGTTACAAT 


TTGAAGTTTT 


CGAACATAGA ATGAAAAACG 


AATATAATGT 


TGATGTTGTT 


9180 
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AAGATGAACA CATCAAGATC GATTTTAGTG AAAGATAGAT ATGACGATTT AGTATTCTTA 9300 

TTTGAAAATG AATTTGCAAC AAGATGGTTT GAAGAGAAAT TCCCTGAAAT TAAATTGTAT 9360 

AGTTTACTTT AACAGCTCAA TTGTATAATC GAATTTGTTA CATTAAAAAT AATTGTTTCG 94 20 

TTGAAGAAAA ATAAATTGTA TATTTTAAAA GAAAAAGGTA TACTATGATG TATCAAATGA 94 80 

ATAACCTATG GCATTTTGTC AGAGGGGAGT AACTTAAGAA TCATGACCGT ATAAATGaTT 954 0 

CGACACTTTA TCGTCATTAC GArGATATCT TCCGGTAAAG TGGGCAATTT AAATTGCTTA 9600 

GTGAGACCTT TGCTATTTAT TTAGCATAGG TCTTTTTGTT TGTACTTAAC TTATTTATTT 9660 

15 AAAGGAGTTG TACATGTTAA TGGATCCAAG TTTGATCTTA CCTTATTTAT GGGTACTTGT 9720 

CGTTTTAGTA TTTTTAGAAG GCTTATTAGC AGCAGATAAC GCGATTGTTA TGGCTGTAAT 9780 

GGTTAAGCAC TTACCACCCG AACAACGTAA AAAAGCTTTG TTTTACGGTT TGTTAGGTGC 9840 

20 ATTTGTATTT AGATTTTTAG CATTATTCTT AATTAGTATT ATCGCGAACT TTTGGTTTAT 9900 

TCAAGCTGCA GGAGCGGTTT ACTTAATTTA TATGTCAATC AAAAATCTGT GGCAGTTCTT 9960 

TAAACACCCA GAAATTGAAA GTCCTGAAGC TGGAGATGAT CAT CATT ATG ATGAATCTGG 10020 

TGAAGAGATT AAAGCAAGTA ACAAATCATT CTGGGGAACT GTGTTGAAAA TAGAATTTGC 10080 

AGATATCGCA TTTGCCATTG ATTCTATGCT TGCTGCTTTA gCTATTGCTG TAACACTTCC 1014 0 

TAAAGTTGGT ATTCACTTTG GTGGTATGGA CTTAGGTCAG TTCGTAGTCA TGTTCCTAGG 10200 

TGGAATGATT GGTGTTATTC TAATGCGTTA TGCAGCAACA TGGTTTGTAG AGCTATTAAA 10260 

CAAATATCCA GGACTTGAAG GTGCAGCCTt CGCGATCGTT GGTTGGGTAG GTGTTAAATT 10320 

AGTTGT CATG GTATTAGCGC ACCCAGAGAT CGCTGTATTG CCTGAGCACT TCCCACATGG 10380 

CGTATTATGG CAATCTATTT TCTGGACAGT ACTAATTGGA TTAGTAATTA TCGGTTGGTT 1044 0 

AGGTTCAGTT GTTAAAAATA AAAAATCGCA TAAATAATTG ATGTGAAGCG GACAATCTTA 1050 0 

40 ATTTAGTTTA AGGTTGTCCT TTTTCATTTA ATTGAGTGAT TTATGAAAAA TGGATTTTGA 10560 

AGAATGTGAA TCAAT^AGATG CGATATAGTA TTAAGAAAAT GTGCCTTTTA TATTTAGCAT 10620 

TTTTTCAATA GAAATTATAT AGATTTTAAA GCAAATTAGG TGTTAATGTG TCATAATGAT 10680 

AAGTGATTTT ATTGAATGGA GTGGACATTA GTGGATATTG GTAAAAAACA TGTAATTCCT 10740 

AAAAGTCAGT nACCsaCGTA AGCGTCGTGA ATTCTTCCAC AACGAAGACA GAGAAGAAAA 10800 

TTTAAATCAA CATCAAGATA AACAAAATAT AGATAATACA ACATCAAAAA AAGCAGATAA 10860 

GCAAATACAT AAAGATTCAA TTGATAAGCA CGAACGTTTT AAAAATAGTT TATCATCGCA 10920 

TTTAGAACAG AGAAACCGTG ATGTTAATGA GAATAAAGCT GAAGAAAGTA AAAGTAATCA 10980 
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AAATTCATTA GATTCAGTGG ACCAAGATAC AGAGAAATCA AAATATTATG AGCAAAATTC 11100 

TGAAGCGACT TTATCAACTA AATCAACCGA TAAAGTAGAA TCAACTGAAA TGAGAAAGCT 11160 

AAGTTCAGAT AAAAACAAAG TTGGTCATGA AGAGCAACAT GTACTTTCTA AACCTTCAGA 11220 

ACATGATAAA GAGACTAGAA TTGATTCTGA GTCTTCAAGA ACTGATTCAG ACAGCTCGAT 112 80 

GCAGACAGAG AAAATAAAAA AAGACAGTTC AGATGGAAAT AAAAGTAGTA ATCTGAAATC 1134 0 

TGAAGTAATA TCAGACAAAT CAAATACAGT ACCAAAATTG TCGGAATCTG . ATGATGAAGT 114 00 

AAATAATCAG AAGCCATTAA CTTTACCGGA AGAACAGAAA TTGAAAAGAC AG CAAAGTCA 11460 

AAATGAGCAA ACAAAAACCT ATACATATGG TGATAGCGAA CAAAATGACA AGTCTAATCA 11520 

TGAAAATGAT TTAAGTCATC ATATACCATC GATAAGTGAT GATAAAGATA ACGTCATGAG 11580 

AGAAAATCAT ATTGTTGACG ATAATCCTGA TAATGATATC AATACACCAT CATTATCAAA 11640 

AACAGATGAC GATCGAAAAC TTGATGAAAA AATTCATGTT GAAGATAAAC ATAAACAAAA 11700 

TGCAGACTCG TCTGAAACGG TGGGATATCA AAGTCAGTCA ACTGCATCTC ATCGTAGCAC 11760 

TGAAAAAAGA AATATTTCTA TTAATGACCA TGATAAATTA AACGGTCAAA AAACAAATAC 11820 

AAAGACATCG GCAAATAATA ATCAAAAAAA GGCTACATCA AAATTGAACA AAGGGCGCGC 11880 

TACGAATAAT AATTATAGTG ACATTTTGAA AAAGTTTTGG ATGATGTATT GGCCTAAATT 11940 

AGTTATTCTA ATGGGTATTA TTATTCTAAT TGTTATTTTG AATGCCATTT TTAATAATGT 12000 

GAACAAAAAT GATCGCATGA ATGATAATAA TGATGCAGAT GCTCaAAAAT ATAGGACAAC 12060 

GATGAAAAAT GCCAATAACA CAGTTAAATC GGTCGTTACA GTTG AAAATG AAACATCAAA 12120 

AGATTCmTCA TTACCTAAAG ATAAAGCATC TCaAGACGAA GTGGGATCAG GTGTTGTATA 12180 

TAAAAAATCT GGAGATACGT TATATATTGT TACGAATGCA CACGTTGTCG GTG ATAAAGA 12240 

AAATCaAAAA ATAACTTTCT CGAATAATAA AAGTGTTGTT GGGAAAGTGC TTGGTAAAGA 12300 

TAAATGGTCA GATTTAGCTG TTGTTAAAGC AACTTCTTCA GACAGTTCAG TGAAAGAGAT 12360 

AGCTATTGGA GATTCAAATA ATTTAGTGTT AGGAGAGCCA ATATTAGTCG TAGGTAATCC 12420 

ACTTGGTGTA GACTTTAAAG GCACTGTGAC AGAAGGTATT ATTTCAGGTC TGAACAGAAA 12480 

TGTTCCTATT GATTTCGATA AAGATAATAA ATATGATATG TTGATGAAAG CTTTCCAAAT 12540 

TGATGCATCA GTAAATCCAG GTAACTCGGG TGGTGCTGTC GTCAATAGAG AAGGAAAATT 12600 

AATAGGTGTA GTTGCAGCTA AAATTAGTAT GCCAAACGTT GAAAnTATGT GATTTGCA 12658 

(2) INFORMATION FOR SEQ ID NO: 128: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6048 base pairs 
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(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 128: 

TGAAATnGAA TAGTACTATT GCAAGTGTAA AGAGGTTAAT TTTTGCCnCA CGCGGGACTT 60 

AAAAAGGCAA CCACTGGTTG TGACATATCC TTATTTACAT TTATAAATAT AAGGAGGAGG 120 

TAGTAGTGAA AGACTTATTG CAAGCACAGC AAAAGCTTAT ACCGGATCTC ATAGATAAAA 180 

TGTATAAACG TTTTTCTATT CTTACTACTA TCTCAAAAAA TCAGCCTGTC GGACGTCGAA 240 

15 GTTTAAGCGA ACATATGGAT ATGACTGAAC GTGTACTGCG TTCTGAAACA GATATGCTTA 300 

AGAAACAAGA TTTGATAAAA GTTAAGCCTA CCGGAATGGA AATTACAGCT GAAGGTGAGC 360 

AACTGATTTC GCAATTGAAA GGTTACTTTG ATATCTATGC AGATGATAAT CGTCTGTCAG 420 

AAGGTATTAA GAATAAATTT CAAATTAAGG AAGTTCATGT TGTTCCTGGT GATG CTGATA 480 

ATAGTCAATC TGTTAAAACA GAATTAGGTA GACAAGCAGG TCAATTACTT GAAGGCATAT 540 

TACAAGAAGA CGCGATAGTT GCTGTAACTG GCGGATGCAC GATGGCATGT GTTAGTGAAG 600 

CAATTCATTT ATTACCATAT AATGTATTCT TCGTACCAGC CAGAGGTGGA CTAGGCGAAA 660 

ATGTTGTCTT TCAGGCAAAC ACAATTGCAG CCAGTATGGc aCAACAAGCT GGCGGTTATT 720 

ATACGACGAT GTATGTACCT GATAATGTCA GTGAAaCAAC ATATAATACA TTGTTGTTAG 780 

AGCCATCAGT CATAAACACT TTAGACAAAA TTAAACAAGC AAACGTTATA TTACACGGCA 84 0 

TTGGTGATGC GCTGAAGATG GCGCATGGAC GTCAATCACC TGAAAAGGTC ATTGAACAAC 900 

35 TTCAACATCA TCAAGCTGTC GGAGAGGCAT TTGGTTATTA TTTTGATACA CAAGGTCAAA 960 

TTGTCCATAA GGTTAAAACA ATTGGACTTC AATT AGAAG A CCTTGAATCA AAAGACTTTA 1020 

TTTTTGCAGT TGGAGGAGGC AAATCGAAAG GTGAAGCAAT TAAAGCATAC TTGACGATTG 1080 

CACCCAAGAA TACAGTGTTA ATCACTGATG AAGCCGCAGC AAAGATAATA CTTGAAT AAG 114 0 

AGATAAAAAG TTTAATACTT TTTAAATATC ATTTTAAAGG AGGCCATTAT AATGGCAGTA 1200 

AAAGTAGCAA TTAATGGTTT TGGTAGAATT GGTCGTTTAG CATTCAGAAG AATTCAAGAA 1260 

GTAGAAGGTC TTGAAGTTGT AGCAGTAAAC GACTTAACAG ATGACGACAT GTTAGCGCAT 1320 

TTATTAAAAT ATGACACTAT GCAAGGTCGT TTCACAGGTG AAGTAGAGGT AGTTGATGGT 1380 

GGTTTCCGCG TAAATGGTAA AGAAGTTAAA TCATTCAGTG AACCAGATGC AAGCAAATTA 144 0 

CCTTGGAAAG ACTTAAATAT CGATGTAGTA TTAGAATGTA CTGGTTTCTA CACTGATAAA 1500 

GATAAAGCAC AAGCTCATAT TGAAGCAGGC GCTAAAAAAG TATTAATCTC AGCACCAGCT 1560 
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ACAGTTGTTT 


CAGGTGCTTC 


ATGTACTACA AACTCATTAG 


\SJ\^\JJ\\j* X X 


TA AAfiTTTT'A 
X X. X X X 


1680 




AACGATGACT 


TTGGTTTAGT 


TGAAGGTTTA ATGACTAUAA 


1 X V-~riV_\jv_ x in 


CACAGGTGAT 


1740 


s 


CAAAATACAC 


AAGACGGACC 


TCACAGAAAA GGTGACAAAC 


GTCGTGCTCG 


TGCAGCGGGA 


1800 




GAAAAGATCA 


TCCCTAACTC 


AACAGGTGCT GCTAAAGCTA 


TCGGTAAAGT 


TATTCCTGAA 


I860 


10 


ATGGATGGTA 


AATTAGATGG 


TGGTGCACAA CGTGTTCCTG 


TAGCTACAGG 


TTCATTAACT 


1920 


GAATTAACAG 


TAGTATTAGA 


AAAACAAGAC GTAACAGTTG 


AACAAGTTAA 


CGAAGCTATG 


1980 




AAAAATGCTT 


CAAACGAATC 


ATTCGGTtAC ACTGAAGACG AAATCGTTTC .TTCAGACGTT 


2040 


15 


GTAGGTATGA 


CTTACGGTTC 


ATTATTCGAC GCTACACAAA 


CTCGTGTAAT 


GTCAGTTGGC 


4 X \J V 




GACCGTCAAT 


TAGTTAAAGT 


TGCAGCTTGG TATGATAACG 


AAATGTCATA 


TAPmP APAA 






TTAGTTCGTA 


CATTAGCATA 


CTTAGCTGAA CTTTCTAAAT 


AATTTTAGTA 


TJ\f i w i - 1 ~ i "VAT* 

X /1V3 X X X X X X* X 




20 


TCAAATACGC 


TAGTGCTCAG 


AACTATTTAG CATTAATT AA 


AGCTTATGAG 


TAAGCGGGGA 






GCACAAACGC 


TTCTCCGCTT 


ATTTTTATAT AAAATTTCCT 


AATTACAAGG 


AGGAAACACC 


^ *a a ft 




ATGGCTAAAA 


AAATTGTTTC 


TGATTTAGAT CTTAAAGGTA 


AAACAGTCCT 


AGT ACGTG CT 


2400 


25 


GATTTTAACG 


TACCTTTAAA 


AGACGGTGAA ATTACTAATG 


ACAACCGTAT 


CGTTCAAGCT 


2460 




TTAGCTACAA 


TTCAATACAT 


CATCGAACAA GGTGGTAAAA TCGTACTATT 


TTCACATTTA 


u 


30 


GGTAAAGTGA 


AAGAAGAAAG 


TGATAAAGCA AAATTAACTT 


TACGTCCAGT 


TGCTGAAGAC 


25oU 


TTATCTAAGA 


AATTAGATAA 


AGAAGTTGTT TTCGTACCAG 


AAACACG CGG 


CGAAAAACTT , 






GAAGCTGCTA 


TTAAAGACCT 


TAAAGAAGGC GACGTATTAT 


TAGTTGAAAA 


TACACGTTAT 




35 


GAAGATTTAG 


ACGGTAAAAA 


AGAATCTAAA AATGATCCAG 


AATTAGGTAA 


ATACTGGGCA 


^ / © u 




TCTTTAGGTG 


ATGTGTTTGT 


AAATGATGCT TTTGGTACTG 


CGCATCGTGA 


GCATGCATCT 


^ O A w 




AATGTTGGTA 


TTTCTACACA 


TTTAGAAACT GGAGCTGGAT 


TCTTAATGGA 


TAAAGAAATT * 


2880 


40 


AAGTTTATTG 


GCGGCGTAGT 


TAACGATCCA CATAAACCAG 


TTGTTGCTAT 


TTTAGGTGGA 


2940 




GCAAAAGTAT 


CTGACAAAAT 


TAATGTCATC AAAAACTTAG 


TTAACATAGC 


TGATAAAATT 


3000 




ATCATCGGCG 


GAGGTATGGC 


TTATACTTTC TTAAAAGCGC 


AAGGTAAAGA 


AATTGGTATT 


3060 


45 


TCATTATTAG 


AAGAAGATAA 


AATCGACTTC GCAAAAGATT 


TATTAGAAAA 


ACATGGTGAT. 


3120 




AAAATTGTAT 


TACCAGTAGA 


CACTAAAGTT GCTAAAGAAT 


TTTCTAATGA 


TGCCAAAATC 


3180 


50 


ACTGTAGTAC 


CATCTGATTC 


AATTCCAGCA GACCAAGAAG 


GTATGGATAT 


TGGACCAAAC 


3240 


ACTGTAAAAT 


TATTTGCAGA 


TGAATTAGAA GGTGCGCACA 


CTGTTGTATG 


GAATGGACCT 


3300 




ATGGGTGTAT 


TCGAGTTCAG 


TAACTTTGCA CAAGGTACAA 


TTGGTGTATG 


TAAAGCAATT 


3360 
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TCTTTAGGTT TTOAAAATGA CTTCACTCAT 

TACCTAGAAG GTAAAGAATT GCCtGGTATC 

5 

AGTTTAAAGT GATGTGGCAT GTTTGTTTAA 

CATCGTGTTT CATCACTTTT CAAAAATATT 

AC CAATTATA GCTGGTAACT GGAAAATGAA 

10 

AATACATTAC CAACACTACC AGATTCAAAA 
ATTCAATTAG ATGCATTAAC TACTG CAGTT 

1£ GGTGCTCAAA ATACGTATTT CGAAGATAAT 

GCATTAGCAG ATTTAGGGGt TAAATACGTT 
TTCCACGAAA CAGATGAAGA AATTAACAAA 

20 ACTCCAATTA TATGTGTTGG TGAAACAGAC 

GTTGTAGGTG AGCAAGTTAA GAAAGCTGTT 
GTTGTAATTG CTTATGAACC AATCTGGGCA 

25 GATGGAAATG AAATGTGTGC ATTTGTACGT 

GTATCAGAAG CAACTCGTAT TCAATATGGT 
TACATGGCAC AAACTGATAT TGATGGGGCA 

30 

GATTTCGTAC AATTGTTAGA AGGTGCAAAA 
TTATTTTAGA TGGTTTTGCG AACCGCGAAA 
■ ACAAGCCTAA TTTTGATCGT TATTACAACA 

35 

- GCTTAGATGT TGGACTACCT GAAGgACAAA 
TCGGTGCAGG acgtatcgtt TATCAAAGTT 

40 gtgatttctt tgaaaatgat gttttaaata 
cagcgttaca catctttggt ttattgtctg 
tatttgcttt gttagaactt gctaaaaaac 

45 ttttagatgg ccgtgacgta gatcaaaaat 
ctaaattcaa tgaattaggc attggtcaat 
tggatcgtga caaacgttgg gaacgtgaag 

50 

ATGCCCCAAC TTATGCAACT GCCAAAGAAG 
CTGACG AATT CGTAGTACCA TTCATCGTTG 

55 



ATTTCAACTG GTGGCGGCGC GTCATTAGAG 34 80 

AAAGCAATCA ATAATAAATA ATAAAGTGAT 3540 

CATTGTTACG GGAAAACAGT CACAAGATGA 3600 

TACAAAACAA GGAGTGTCTT TAATGAGAAC 3660 

CAAAACAGTA CAAGAAGCAA AAGatTCGTC 3720 

GAAGTAGAAT CAGTAATTTG TGCACCAGCA 3780 

AAAGAAGGAA AAGCACAAGG TTTAGAAATC 3840 

GGTGCGTTCA CAGGTGAAAC GTCTCCAGTT 3900 

GTTATCGGTC ATTCTGAACG TCGTGAATTA 3960 

AAAGCGCACG CTATTTTCAA ACATGGAATG 4020 

GAAGAGCGTG AAAGTGGTAA AGCTAACGAT 4 080 

GCAGGTTTAT CTGAAGATCA ACTTAAATCA 4140 

ATCGGAACTG GTAAATCATC AACATCTGAA 4200 

CAAACTATTG CTGACTTATC AAGCAAAGAA 4260 

GGTAGTGTTA AACCTAACAA CATTAAAGAA 4320 

TTAGTAGGTG GCGCZATCACT TAAAGTTGAA 43 80 

TAATCATGGC TAAGAAACCa ACTGCGTTAA 444 0 

GCGAACATGG TAATGCGGTA AAATTAGCAA 4500 

AATATCCAAC GACTCAAATC GAAGCGAGTG 4560 

TGGGTAACTC AGAAGTTGGT CATATGAATA 4620 

TAACTCGAAT CAATAAATCA ATTGAAGACG 4680 

ATGGAATTGC ACACGTGAAT TCACATGATT 474 0 

ACGGTGGTGT ACACAGTCAT TACAAACATT 4 800 

AAGGTGTTGA AAAAGTTTAC GTACACGCAt 4860 

CCGCTTTGAA ATACATCGAA GAGACTGAAG 4920 

TTGCATCTGT GTCTGGTCGT TATTATGCAA 4 980 

AAAAAGCTTA CAATGCTATT CGTAATTTTG 504 0 

GTGTAGAAGC AAGCTATAAT GAGGGCTTAA 5100 

AGAATCAAAA TGACGGTGTT AATGATGGAG 5160 
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CGAACAGAGC 


ATTCGAAGGC 


TTTAAAGTTG 


AACAAGTTAA 


AGACTTATTC 








TCACTAAGTA 


TAATGACAAT 


ATCGATGCGG 


CTATCGTCTT 


- /"•/"* A 7\ TV 7\ 7\ /wpf 
LuAAAAAu 1 1 


X X 1/vviln 




5 


ATACAATTGG 


TGAAATTGCA 


CAAAATAACA 


ATTTAACTCA 


AilALblAl X 


uUvjnnnU x V7 






AAAAATACCC 


TCACGTTACT 


TACTTTATGA 


GTGGTGGACG 


TAACGAWiAA 






10 


AACGCCGTCG 


TTTAATTGAT 


TCACCTAAAG 


TTGGAACGTA 


TGACTTGAAA 






GTGCTTATGA 


AGTTAAAGAT 


GCATTATTAG 


AAGAGTTAAA 


TAAAGGTGAC 


TTGGACTTAA 






TTATTTTAAA 


CTTTGCTAAC 


CCTGATATGG 


TTGGACATAG 


TGGTATGCTT 


GAGCCGACAA 




15 


TCAAAGCAAT 


CGAAGCGGTT 


GATGAATGTT 


TAGGAGAAGT 


GGTTGATAAG 


ATTTTAGACA 


3 /UU 




TGGACGGTTA 


TGCAATTATT 


ACTGCTGACC 


ATGGTAACTC 


TGATCAAGTA 


TTGACGGaTG 


3/bU 




ATGATCAACC 


AATGACTACG 


CAwACAACGA ACCCAGTACC AGTGATTGTA ACAAAAGAAG 


5820 


20 


GCGTTACACT 


TAGAGAAACT 


GGTCGCTTAG 


GTGACTTAGC 


ACCTACATTA 


TTAGATTTAT 


5880 




TAAATGTAGA 


ACAACCTGAA 


GATATGACAG 


GTGAaTCTTT 


AATTAAACAC 


TAATATTGTA 


5940 




AAAGATGTTA 


AGTAAACGCT 


TAATGACACT 


TATTTTTTGA 


AAATAATAGT 


AATATCnTTT 


6000 


25 


TGTTAAATGA 


AAGAATAAAG 


CTATAATAAT 


TATAGAATAA 


CTATTTAn 




6048 



(2).- INFORMATION FOR SEQ ID NO: 129: 

(i) SEQUENCE CHARACTERISTICS: 
30 (A) LENGTH: 5602 base pairs 

<B) TYPE: nucleic acid 
(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 

35 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 129: 



40 



45 



50 



AAAGAAGTGC 


AAGATATCAT 


CGCATTAATT 


AAGTCGTTAC AAAgTGTAAT 


TGTAGACaTC 


60 


GCTTCCAATA 


ATGTTGATAC 


AATTATGCCT 


GGTTATACTC 


ATTTACAGCG 


TGCACAGCCA 


120 


ATTTCATTTG 


CACATCATAT 


TATGACTTAT 


TTTTGGATGT 


TACAACGAGA 


CCAACAACGA 


180 


TTTGAAGATA 


GTTTAAAACG 


AATCGATATT 


AATCCTTTAG 


GTGCAGCAGC 


CTTAAGTGGT 


240 


ACCACATACC 


CTATCGATAG 


ACACGAGACA 


ACAGCATTGT 


TGAACTTTGG 


CAGTCTCTAT 


300 


GAGAATAGCC 


TAGATGCTGT 


TAGTGACAGA 


GACTATATTA 


TTGAAACATT 


GCATAATATT 


360 


TCTTTAACGA 


TGGTTCACTT 


ATCACGCTTT 


GCAGAGGAAA 


TTATTTTCTG 


GTCCACAGAC 


420 


GAAGCTAAAT 


TCATTACATT 


ATCAGATGCA 


TTTTCAACTG 


GCTCATCTAT 


TATGCCACAA 


480 


AAGAAAAATC 


CTGATATGGC 


AGAATTAATT 


AGAGGTAAAG 


TTGGTCGAAC 


GACTGGTCAT 


540 



55 
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GAAGATAAAG 


i AAGGTTTATT 


CGATGCTGTC 


CAtACAATTA AAGGTTCTTT 


ACGTATTTTC 




GAAGGTATGA 


. TTCAAACGAT 


GACAATTAAT AAAGAACGAC 


TCAATCAAAC 


TGTTAAAGAA 


* 720 


GATTTTTCAA ATGCAACGGA 


ACTAGCAGAT 


TATTTAGTAA 


CTAAAAATAT 


TCCATTTAGA 


780 


ACTGCACATG 


AAATTGTAGG 


AAAAATCGTC 


TTAGAATGTA 


TACAACAAGG 


TCATTATTTA 


840 


TTAGATGTTC 


CTTTAGCAAC 


ATATCAACAA 


CATCATTCTA 


GTATTGATGC 


1 CGATATTTAC 


900 


GATTATTTGC 


AGCCTGAAAA 


TTGTTTAAAA 


CGACGTCAAA 


GTTACGGTTC 


AACAGGTCAA 


960 


TCATCGGTCA 


AACAACAACT 


TGATGTTGCT 


AAACAATTAC 


TATCACAATA 


AATACGTTAA 


1020 


TCTACCTACC 


CAGAATGTCT 


ATTAAAATTA 


CATTGTGGGT 


ATTTTAATGC 


T(2*Tf*'I*'I*fY2 r r*f > 
± \- x x x x «•» 


i nan 


TTGTTGAACA 


TCACATTTTT 


AAGATTCCTA 


AAATGTTTGA TAATTCTTTT 


AAATTTATAT 

nnni x mini 




TACAAAAATG 


TTATAAATTG 


TAAAAGAAAT 


GTGTAAAGCG 


TTTTCACAAG 


V^XlVJ'w X X X X X vJ 


J. ^ \J u 


TAGTATTTTA 


AAATTGTTAG 


AGTACAAATA 


AAGAGATGAA 


AGGATAAAGA 


PTATYlArTAA 




CTCTTCGAAA 


AGCTTCACTA 


AATTTATGGC 


TGCTTCTGCT 


GTTTTTACTA 


luuuni ill 1 


x. JZU 


ATCAGTACCT 


ACTGCTGGCG 


CTGAACAAAC 


AAATCAAATT 


GCAAATAAAC 


X V»n\JV7(b. X a ± 


i J 15 U 


TCAATGGCAT 


ACAAATTTAA 


CGAATGAGCG 


ATTCACTACT 


ATCGCACATC 




1 JL A f\ 


TGGCTATGCA 


CCCGAGCATA 


CGTTTCAAGC 


ATATGATAAG 


AGTCATAATG 




i can 


ATCTTATATC 


GAAATTGATT 


TACAACGTAC 


C A A AfS ATCZCZC 


I X X 1. ±\j 




1 CCA 


TGAAACTGTT 


AACCGTACAA 


CAAATGGACA 


CGGTAAAGTT 


GAGGATTATA 




J. O A U 


ATTAAAACAG 


TTAGATGCAG 


GAAGTTGGTT 


TAATAAAAAA 


TATCCAAAAT 


AfY3 P aan Af; c 


1 COA 
X O O \J 


AAGTTATAAA 


AATGCTAAAG 


TACCCAGTTT 


AGATGAAATT 


TTAGAACGTT 


ATGG CC CGAA 


1740 


TGCAAACTAT 


TATATTGAAA 


CAAAGTCACC 


TGATGTATAC 


CCAGGAATGG 


AAGAACAATT 


1800 


ATTAGCTTCA 


TTGAAAAAGC 


ATCACCTTTT 


AAATAACAAT 


AAATTAAAAA 


ATGGACATGT 


I860 


AATGATTCAA 


TCATTTTCTG 


ACGAAAGTTT 


AAAGAAAATT 


CAT CGTCAAA 


ATAAGCATGT 


1920 


GCCATTAGTA 


AAATTAGTTG 


ATAAAGGTGA 


ACTACAACAA 


TTTAACGACC 


AACGCTTAAA 


1980 


AGAGATACGC 


TCTTATGCGA 


TTGGATTAGG 


TGCTGATTAT 


ACAGATTTAA 


CTGAACAAAA 


2040 


TACCCATCAT 


TTAAAAGACT 


TAGGATTTAT 


AGTACATCCT 


TATACAGTGA 


ATGAAAAAGC 


2100 


TGATATGTTA 


CGATTAAATA 


AATATGGCGT 


TGATGGTGTC 


TTTACAAATT 


TCGCTGATAA 


2160 


ATATAAAGAA 


GTCATTAAGT 


AGTAATGTTA 


AACTAGAAAA 


CATAAATACA 


AAAAT AT AG C 


2220 


TATTACTATA 


AAAAACAGCA 


GTAAGATATT 


TCCAAATTGA 


AATTATCCTA 


CTGCTGTCTT 


2260 


TTTGGGAGTG 


GGACAGAAAT 


GATATTTTCG 


CAAAATTTAT 


TTCGTCGTCC 


CACCCCAACT 


2340 
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TTGTCTGTAG AAATTGAGGA GCTAATTTCT CTGTGTCGGG GCTCCACCCC AACTTGCACA 2460 

CTATTGTAAG CTGACTTTCC GCCAGCCTCT GTGTTGGGGC CCCGCCAACT TGGACACTAT 2520 

TGTAAGCTGA CTTTCCACCA GCCTCTGTGT TGGGGCCCCG AGTATTTTTG AAAAGAGCGT 2580 

GTTACACGGG CATTGTTTTA CAGTCAACTA CTGCTAAAAT AAAATTAACG AGCTTAGGGC 2640 

TTTGTTTTCT GTCCCAAGCT CGTTAAATCA CATATGATAA TTAATTATGC CCAACCACGA 2700 

TATCTAGCTG CTTCTGCTGT ACGTTTAATA CCTATGATAT ATGCTGCAAG TCTCATATCT 2760 

ATTTTTCGGT TTTGAGACAA TTOGTAAATC GTATCAAATG CCGCTTCTAA TTTTTCACGT 2820 

AGCTTTTCAT TAACTTCTTC TTCAGACCAA TAATAACCTT GATTATTTTG TACCCATTCG 2880 

AAGTAAGAAA CCGTtACACC ACCAGCACTT GCTAATACGT CTGGAACTAA TAATATACCA 2940 

CGTTCAGTTA AAATACGTGT TGCTTCTGGT GTTGTAGGTC CATTAGCAGC TTCAACAACG 3000 

ATACTAGCTT TAATATCATG TGCATTGTCT TCTGTAATTT GGTTTGAAAT AGCCGCTGGT 3060 

ACTAAAATGT CACAATCTAA TTCAAACAAT TCTTTATTTG AGATTGTTTC TTCAAATAAA 3120 

TTTGTTACCG TACCAAAACT ATCACGACGG TCTAATAAAT AATCTATATC TAAGCCATTT 3180 

GGATCGTGTA ATGCACCGTA AGCATCAGAG ATACCTACAA TTTTTGCACC TAAATCATAT 3 240 

AAGAATTTAG CTAAGAAACT TCCGGCATTA CCGAAACCTT GAATAACAAG CTTGGCACCT 3300 

TCAATTTGCA TATTACGACG TTTTGCAGCT TGTTCAATTG CAATAACTAC ACCTAGTGCA 3360 

GTTGATCTGT CGCGTCCATG AGAACCACCC AATACAATTG GTTTACCTGT GATGAAACCT 3420 

GGTGAATTAA ATTTATCTAA TGCACTATAT TCATCCATGA TCCAAGCCAT AATTTGTGAG 3480 

TTTGTAAATA CATCTGGTGC TGGAATATCT TTGTTCGGAC CTACGAATTG TGAAATTGCT 354 0 

CTTACATATC CGCGTGATAA ACGTTCAACT TCATGAATGC TCATTTGACG TGGATCACAA 3600 

ACGATACCAC CCTTACCACC ACCGTATGGT AAGTTTACAA TGCCACATTT CAAAGTCATC .3660 

CACATTGATA ATGCTTTTAC TTCTTCTTCA TCAACATCTG GGTGGAAACG CACGCCCCCT 3720 

TTTGTTGGTC CAACAGCATC ATTATGTTGC GCACGGTAAC CTGTGAATGT TTTTACTGTG 3780 

CCATCATCCA TTCGTACAGG GATACGCACT TGTAACATTC TTAAAGGTTC TTTAATTAAA 384 0 

TCGTACATTC CTtCGTCAAA TCCCAATTTA TGCAATGCTT CTTTAATAAT TCCTTGAGTA 3900 

GAAGTTACTA AATTATTGTT CTCAGTCATG ATCCTTTTCG CCTCTTCTTT ACCTAATGAT 3960 

TTCGCTTTCA AACATATTGT AACATAACGT ATTCCTTTTT AAAGCCCTTA CAAACTGATT '4020 
GTTACAACTT TTTGACATTA TTGAAATACA TGTCTTATTT TTTCAAGTGC AAGGTCCAAT - 4080 

TCTT CT TTAG TAATAATTAA TGGTGGTGCA AAACGAATGA CAGTATCATG CGTTTCTTTA 414 0. 
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ACACCTATAA 


ACAAACCACG 


TCCACGGACT 


TCTTTAATTG 


ATGGATGATC 


AATTTGCTTT 


4260 


AATTGTTCTT 


TAAAATAATC 


TCCTAATTCT 


AAAGAGCGGC 


CTGGTAAATC 


CTCATCAACG 


4320 


ATAACATCTA ATGCAGCAAT 


TGATGCAGCA 


CAAGCAAGTG 


GATTACCACC 


AAATGTTGAA 


4380 


CCATGTGAGC 


CAGGTGTAAA 


GACATCTAAT 


ACTTCTTTAT 


CTGCTAATAC 


AACAGAAATT 


4440 


GGGAAGACTC 


CACCACCTAG 


TGCTTTACCT 


AAAATATAGA 


CATCAGGTTT 


TACATTATCC 


4500 


CAATCCGTAG 


CAAATAATTT 


ACCCGAACGA 


CCTAATCCTG 


CTTGGATTTC 


GTCAGCAATA 


4560 


AATAAGACAT 


TATGTTCATC 


ACATAATTCT 


CTAATTGGTT 


TCAAATATCC 


TTCTGGCGGT 


4620 


ATATTTATAC 


CCGCTTCACC 


TTGAATTGGT 


TCTACTAAAA 


CTGCTGCAGT 


ATTTTCATTA 


4680 


ATTGCAGCTT 


TCAATG CATC 


TACATCTCCA 


AAATCAACTT 


TTCTAAATCC 


ATCTAATAAC 


4740 


GGACCATAAC 


CACGTTGGTA 


TTCTGCTTCT 


GAAGATAATG 


AAACTGGCGC 


CATTGTTCGA 


4800 


CCATGGAAGT 


T AC CATT AAA 


TGCAATGATT 


TCTGCTTTAT 


TTGGCTCAAT 


TCCTTTAACA 


4860 


TCGTATGCCC 


AGCGTCGTGC 


TGCTTTCAAA 


GCTGTTTCTA 


CTGCTTCAGC 


ACCTGTATTC 


4920 


ATTGGTAAAG 


CTTTATCTTT 


ACCTGCCAGT 


TTACAAATTT 


TTTCGTACCA 


TTCACCTAAG 


4980 


TTATCACTAT 


GAAAAGCACG 


TGAAACTAAA GTCACTTTAT 


CAGCTTGATC 


TTTTAATGCT 


5040 


TGAATAATTT 


TCGGATGTCT 


ATGACCTTGG 


TTAACAGCGG 


AATATGCAGA 


TAACATATCC 


5100 


ATATATTTAT 


TGCCTTCAGG 


ATCTTTAACC 


CATACCCCTT 


CAGCTTcTGa 


AATGaCAATT 


5160 


GGcAATGGTA 


AATAATTATG 


TGCTCCGTAA 


TGATTTGTTA 


ACTCAATAAT 


TTTTTCAGAT 


5220 


TTAGTCATCA 


TATCTCCCCT 


TTTCATCATT 


TATAACTATT 


ATACATGAAA 


CATTATCCAA 


5280 


ATAATTACAT 


TAGTTTTCAA 


AGCAGATACT 


TTTCCACCAA 


AAAAGATGAA 


ATAATCACTA 


5340 


AGTTTGATTA 


AATTTGTCTA 


TTTTGAAAAC 


CCTTACATTT 


ATAATGACAT 


AATTACTTAA 


54 0 0 


ATGaTTACAA GCAAAAGAAT 


TGATAATTTT 


ACACTTAATC 


AAAAGTATAT 


TTTACTAAGA 


5460 


ATATTTTTAT 


TTATAAATAT 


TGAAAACCAC 


TAACAAATTG 


CATACACAAT 


ATCATTAGTG 


5520 


GTAACAGTTA AACACTTATT 


TAT CTTTACG 


GGGTAATGGG 


TTAAAACCCT 


TnCATTAAAA 


5580 


TTGGATGnCC 


ATAAAATTAG 


GG 








5602 


(2) INFORMATION FOR SEQ ID NO: 130: 









(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5924 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
50 (D) TOPOLOGY: linear 
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TAACCCCATT TTACCTGGAA AAATCgTTTG CGATGCaATm GCaTTtGaAT AT AaATACAT • 
TTTACGTATa GAATTATAAA AgGTTTCATT CaAATCTTAG GGTCAAAAAT GTTATAATAT 
TTTTATGTCA AATTTAAAAC AGTAACACTT ATTTACAAGG TTGCAATATT TTGAAGTAAT 
AAAGGAAGTG TCGCGTATTT TAACTTTTTC AGAGCAAAAT GCACTCGCGA AAATAGATGA 
TTTAATGAAT ACTTATTGCA ATCAATGTCC AATCAAAACT CGTCTGCGTA AATTAGAGGG 
- G AAAACGAAG GCGCATCATT TTTGTATCAA TGAGTGTTCA ATAGGGAAAG AAATAAAACA 
ATTAGGAAAT GAACTTCAAT AGGAGGAAGT CAAATGAAAA TTATATCTAT ATCAGAAACA 
CCGAACCACA ACACAATGAA GATTACACTT AGTGAAAGCA GAGAAGGTAT GACATCAGAT 
ACGTATACTA AAGTTGATGA TTCACAGCCA GCATTTATTA ATGACATCTT AAAGGTTGAA 
GGCGTTAAAT CAATTTTCCA TGTTATGGAC TTTATTTCAG TAGATAAAGA AAATGACGCA 
AATTGGGAAA CAGTATTGCC AAAAGTAGAG GCTGTATTCG AATAAATTTT TCATCAACTA 
GTATTCGGGG GGAATAAAGT ATATGGAAAT TTTACGTATA GAGCCAACAC CAAGTCCAAA 
TACAATGAAA GTTGTTTTGT CATATACAAG AGAAGACAAG TTATCTAATA CTTATAAAAA 
AGTAGAAGAA ACACAACCAA GATTTATAAA TCAGTTGTTA T C T AT AGATG GTATCACTTC 
CATTTTTCAT GTCATGAACT TCTTAGCTGT TGATAAGGCA CCAAAAGCTG ATTGGGAAGT 
CATATTACCT GATATTAAAG CTGCTTTTTC TGATGCGAAT AAGGTTTTAG AATCTGTAAA 
TGAACCTCAA ATTGACAATC ATTTTGGTGA AATTAAAGCT GAATTATTAA CTTTTAAGGG 
TATACCGTAT CAAATTAAGC TAACTTCTGC TGACCAAGAA TTAAGAGAAC AATTACCACA 
AACATATGTT G AC CAT ATGA CTCAAGCGCA AACAGCACAT GACAATATTG TTTTTATG CG 
TAAATGGCTA GATTTAGGAA ATCGCTATGG AAATATTCAA GAAGTAATGG ATGGTGTCCT 
AGAAGAAGTG CTAGCTACCT ATCCAGAATC ACAGTTACCC GTATTGGTAA AACATGCTTT 
AGAAGAAAAT CACG CAACT A ATAATTATCA TTTCTATCGA CATGT CTCTT TGGATGAATA 
TCATGCAACT GATAATTGGA AGACTCGATT ACGAATGTTA AACCATTTTC CAAAGCCGAC 
TTTTGAAGAT ATACCGCTGC TTGATTTAGC TTTATCTGAT GAAAAAGTAC CGGTTAGACG 
TCAAGCGATT GTATTATTAG GTATGATTGA AAGTAAAGAA ATTTTACCGT ATTTATATAA 
GGGGCTTCGT GATAAAAGTC CTGCTGTAAG AAGAACAGCA GGGGATTGCA TAAGCGATTT 
AGGGTATCCA GAGG CACTAC CAGAAATGGT GCTACTATTA GATGATCCAC AGAAAATCGT 
TAGGTGGCGT GCTGCTATGT TTATCTTTGA TGAAGGTAAT GCAGAGCAGC TTCCCGCACT 
AAAAGCCCAT ATTAATGACA ATGCGTTTGA AGTTAAATTA CAAATTGAAA TGGCCATATC 
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AATTTAATTG 


GAGGAATTAA 


ATATGAATGC 


ATATGATGCT 


TATATGAAAG 


AAATTGCGCA 


I860 




ACAAATGCGT 


GGCGAATTAA 


CTCAAAATGG 


TTTTACAAGT 


TTAGAAACGA 


GCGAACAGct 


1920 


5 


ATCGGAGTAT 


ATGAACCAAG 


TAAATGCTGA 


TGACACTACT 


TTTGTAGTTA 


TTAACTCTAC 


1980 




ATGCGGCTGT 


GCAGCTGGAT 


TAGCAAGACG 


AGCTGCAGTA 


GCAGTTGCAA 


CACAAAATGA 


2040 


10 


ACATAGACCT 


ACAAATACAG 


TTACAGTTTT 


TGCTGGGCAA 


GATAAAGAAG 


CAACTGCTAC 


2100 


AATGCGAGAA 


TTCATTCAGC 


AAGCACCATC 


TAGTCCTTCG 


TATGCTTTAT 


TCAAAGGTCA 


2160 




AGATTTAGTT 


TATTTTATGC 


CTAGAGAATT 


TATCGAAGGT 


AGAGATATTA 


ATGACATTGC 


2220 


15 


AATGGACTTA 


AAGGATGCCT 


TTGACGAAAA 


TTGTAAATAG 


TACACATAAA 


TAAATATAAA 


2280 




GGTTAACACA 


TTTTATAATA 


TTAAAAATGG 


TGTCTGTCAT 


TGAAAATAGA 


GAATATAGTT 


2340 




GTATTCTATT 


TGTTAAATAA AGTCCGTTTT 


TACCaACTAT 


ATTTTCTAGA 


AATTTAACTG 


2400 


20 


TTTTAATAGG 


ACATCAAACA 


TAATATTCaA 


ATCaTGTGTT 


AACCTCTTTT 


TTAAAATTTT 


2460 




TTAGCATTAA 


AGTTATAGAT 


TTGGGTAAAC 


AATTACCAAT 


TGGAAACATA 


TATCACGTTA 


2520 




CGATGGGGTA 


GGTACTTAAT 


CAGCATTTTA 


TAAATAAAGT 


AACGGAATTC 


ATGAT ATTAA 


2580 


25 


TATCATATTC 


CTAAAATGAG 


TGATAACAAA 


ATGCTACATA 


AAGTTAAGTT 


ATATCAAACT 


2640 




AAATATACAT 


ACTATAAATA* 


ATGAAAATGA 


GGTGTTATCG 


CATATGTTGA 


ATTCATTTGA 


2700 


30 


TGCAGCATAT 


CACAGTCTTT 


GTGAAGAAGT 


TTTAGAAATA 


GGAAATACAC 


GAAATGATCG 


2760 


CACAAATACA 


GGTACGATTT 


CGAAATTTGG 


TCATCAACTT 


CGCTTTGACT 


TATCTAAAGG 


2820 




ATTTCCACTA 


TTAACGACAA 


AGAAAGTTTC 


TTTTAAATTA 


GTAGCAACCG 


AATTATTATG 


2880 


... 

35 


GTTCATTAAA 


GGAGATACAA 


ACATCCAATA 


CTTATTAAAA 


TATAATAATA 


ATATATGGAA 


2940 




CGAATGGGCT 


TTTGAAAATT 


ATATGAAATC 


AGACGAGTAT 


AAAGGTCCAG 


ATATGACAGA 


3000 




TTTCGGGCAT 


CGTGCATTGA 


GTGATCCTGA 


ATTTAACGAA 


CAATATAAAG 


AACAAATGAA 


3060 


40 


ACAATTTAAG 


CAACGTATTC 


TTGAAGATGA 


TACATTTGCG 


AAGCAATTCG 


GGGATTTAGG 


3120 




AAATGTTTAT 


GGTAAACAAT 


GGCGAGATTG 


GGTTGATAAA 


GATGGTAATC 


ATTTTGATCA 


3180 




ACTTAAAACA 


GTAATTGAAC 


AAATTAAGCA 


TAATCCAGAT 


TCAAGGCGAC 


ACATCGTATC 


3240 


45 


TCCATGGAAT 


CCAACAGAAA 


TTGATACAAT 


GGCACTTCCG 


CCTTGTCATA 


CCATGTTCCA 


3300 




GTTTTATGTC 


CAAGATGGTA 


AGTTAAGTTG 


CCAGTTATAC 


CAACGTAGCG 


CAGATATCTT 


3360 


50 


TTTAGGTGTG 


CCATTTAATA TCcGCagctA 


CGCTTTATTG 


ACACACCTTA 


TTGCCAAAGA 


3420 


ATGTGGACTT 


GAAGTGGGTG 


AATTTGTGCA 


TAGATTTGGA 


GATGCACATA 


TTTATTCAAA 


3480 




TGATATTGAT 


GCGATTCAAA 


CACAATTAGC 


ACGTGAAAGC 


TTCAATCCTC 


CAACATTAAA 


3540 
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TGAATCACAT 
CATATAGACA 
TAAACGTTTT 
TGTTAAATTA 
TGACTTTATC 
TACCTTGGcA 
TAGTAATGGG 
TTGTACTTAC 
AAGATATTTA 
AAATGATTGA 
ATACGTTCTT 
ACTAGATGAG 
GGGAAAACGA 
GAATACTTAG 
TCATACGTTG 
GAAGATGTAA 
GGAAAAGATG 
AACACTGCTT 
TCTATTTCTT 
GtCTCAACTT 
GTAGTTATAG 
TTGATTGGTA 
CTTGTGCmCA 
GAATTTATAG 
TATGTTGATA 
AATGTAACTA 
CTTAAGAAGT 
TAAATTTATA 
AGCAGGAGGA 



CCAGCAATAA 
TCAAAATGAC 
CATAAATTAT 
AAGATAACTT 
CATTCTAGTt 
CCTACCAAAT 
TCGTAAGACA 
TTCAGATACA 
CCAACTACCG 
TAAAGTGGAC 
TCCACCTTAT 
AAAAATACAA 
CCATGACAAA 
AAGCAAACAA 
ACCAAGTAGA 
AGACAAGTCA 
GCTCTGAAAT 
ACCAAGCAAG 
TTGGTTTAGG 
CTGAAATAGT 
GGCAATTGAA 
ATCTTATGAA 
ATGCGAGAAC 
GAGATCATGA 
AATTGAAGAA 
CACCAGTTAT 
AAATTTAATC 
ATTAGATAGA 
TGTTTCTGGT 



AAGCTCCAAT 
ATCATAGTAT 
GCAAAATCAT 
AGTAATAAAA 
GCACATGACT 
GATTTGAAGC 
TTTGAATCGA 
AGTTrCAACG 
GGCCATGTTT 
GACATGTATA 

mCATTkGAgr 

TTCCACATAC 
ACAGATTATA 
CATTCATGTA 
TATTACATCA 
GCCAGCCATA 
CATAAGTATT 
TCAAATGGTA 
GTATCAAATA 
TAAAAAGTTA 
TCAATTAATT 
AATTAAACCA 
TCaAAATTCk 
AATCAAATCC 
AGTTTTTAAT 
TTCTGCACAT 
TTTTCAGTGT 
TAGAGGAGGT 
GCATGGTTAA 



AGCAGTGTAG 
TTTCAAGTGC 
TATTTCTATC 
AATGAAATGA 
TGCAACGAGT 
ATGTTAAAAA 
TTGGTAAACC 
TAGAnGGCGT 
TCATATTTGG 
TTACTGTTAT 
CTGGGAAGTT 
CTTTCTACAT 
GTAACAGACT 
ATTCCTTTAA 
GAAGAATTTA 
GGTGAATTTA 
CATCTTTCTT 
GATGCTAATG 
CAACACCTAG 
AAT CATTTAA 
AAAGGTGGCA 
ATTGGTACAC 
AGTATCCAAT 
ATTGGTGTCG 
GAAGCTTTTC 
ACTGGTCAAG 
TAATTACTTC 
AATTCATATG 
AC CATTTACA 



TCATTGCATA 
AAAAAAGTAC 
ACACTTTATG 
TAGAAGAAGG 
AATTGGTTTt 
ATTATCAACA 
ACTACCGAAT 
TGATGTAATT 
AGGGCAAACA 
TGAAGGTAAA 
GCCTCTTCAG 
TTAATTCGTA 
CAACATCCGA 
GTTTAACTAT 
TTAATCATAT 
TATCTGCTTA 
CAGGATTAAG 
TAACTGTTAT 
TAGAGCTTGT 
GAGAAAACAT 
GAATTAGTAA 
TAGATGATGG 
ACTTGAAAAA 
CACATGCTAA 
ATGTGAATAA 
GTGCGATTGG 
CATTTCAATC 
ACAAAAGAAT 
TCATATCCAG 



GTTAGCTAAC 
TTTTTTGTGT 
ATAAAAATTG 
AGGATAATTA 
GAAAATCAAT 
GGTCATACTT 
CGTCGAAATG 
CACTCTATTG 
TTATTTGAAG 
TTCCGTGGTG 
TTGAAGGTAA 
AAAAATAAGG 
TTTATCTAAA 
TGAAGGAGCT 
TGAAAATGAT 
TGAAGAACTA 
TGGTACATAT 
TGATTCAAAA 
AAAAgAaGGT 
TAAATTATTT 
AACAAAAGGT 
TCGCTTAGAG 
GGAAATTGCT 
CGTCATTGAA 
TTACGATATA 
CCTCGTAGTC 
CTTTATAGAC 
ATGCAACATT 
GCATCAAGTC 



3660 

3720 

3780 

3840 

3900 

3960 

4020 . 

4080 

4140 

4200 

4260 

4320 

43 BO 

4440 

4500- 

4560 

4620 

4680 

4740 

4800 

4860 , 

4920 

4980 

5040 

5100 

5160 

5220 

5280 

5340 
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GAATCAAACC GGCCATGTCG AAGCAGTACA AATTACGTTT GATCCAGAGG TTACTTCCTT 5460 

TGAAAATATA TTAGACATAT ATTTCAAAAC ATTTGACCCA ACTGATGATC AAGGGCAATT 5520 

TTTCGATAGA GGCGAAAGCT ATCAACCAGT CATTTTCTAT CATGATGAAC ATCAGAAAAA 5580 

GGCTGCTGAG TTTAAAAAGC AACAATTAAA TGAACAAGGT ATTTTCAAGA AACCAGTGAT 5640 

TACACCTATT AAACCATATA AAAATTTCTA TCCAGCTGAA GACTACCATC AAGATTATTA 5700 

CAAAAAGAAC CCGGTACATT ATTACCAATA TCAACGTGGT TCAGGTAGAA AAGCGTTTAT 5760 

AGAATCACAT TGGGGGAATC AAAATGCTTA AAAAAGATAA AAGTGAACTA ACAGATATAG 5820 

15 AATATATTGT TACACAAGAn AACGGCACTG AACCACCATT TATGAATGAA TATTGGAATC 5880 

ATTTTGCTAA AGGATTTATG TAGATAAAnT TCnGGTAAAC CTTG 5924 
(2) INFORMATION FOR SEQ ID NO: 131: 

20 (i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 92 80 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

25 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 131: 

GGCCGTTnAA AATCTCCAAA ATAnAAAAAC CCATCTTGTT CCAATGTTTT AAAATCGCCa 6 0 

TCCaACACTT GaTCaATAGC TTGCAACAAC GTTGAACGTG TTTTaCCAAA AGCATCaAAC 120 

GCTCCCACTA AAATCAGTGC TTCAAGTAAC TTTCTCGTTT TGACTCTCTT OGGTATACGT 180 

CTAGCAAAAT CAAAGAAATC TTTAAATTTG CCGTTCTGAT AACGTTCATC AACAATCACT 24 0 

TTCACACTTT GATAACCAAC ACCTTTAATT GTACCAATTG ATAAATAAAT GCCTTCTTGG 300 

GAAGGTTTAT AAAACCAATG ACTTTCGTTA ATGTTCGGTG GCAATATAGT GATACCTTGT 360 

TTTTTTGCTT CTTCTAT CAT TTGAGCAGTT TTCTTCTCAC TTCCAATAAC ATTACTTAAA 420 

ATATTTGCGT AAAAATAATT TGGATAATGG ACTTTTAAAA AGCTCATAAT GTATGCAATT 480 

TTAGAATAGC TGACAGCATG TGCTCTAGGA AAACCATAAT CAOCAAATTT CAGAATCAAA 540 

TCAAATATTT GCTTACTAAT GTCTTCGTGA TAACCATT TT GCTTTGCACC TTCTATAAAA 600 

TGTTGACGCT CACTTTCAAG AACAGCTCTA TTTTTTTTAC TCATTGCTCT TCTTAAAATA 660 

TCCGCTTCAC CATAACTGAA GTTTGCAAAT GTGCTCGCTA TTTGCATAAT TTGCTCTTGA 720 

TAAATAATAA CACCGTAAGT ATTTTTTAAT ATAGGTTCTA AATGCGGATG TAAATATTGA 780 

ACTTTGCTTG GATCATGTCT TCTTGTAATG TAAGTTGGAA TTTCTTCCAT TGGACCTGGT 840 
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ACACTTCTTA CAC CGTCAGA CTCTAATTGG AATATGCCAG TCGTATCTCC TTGCGACAAC 960 

AATTCAAACA CTTTTTGATC ATCAAACGGA ATCTTTTCGA TATCAATATT AATACCTAAA ^1020 

5 TCTTTTTTGA CTTGTGTTAA GATTTGATGA ATAATCGATA AGTTTCTCAA CCCTAGAAAA 1080 

TCTATTTTTA ATAACCCAAT ACGTTCGGCT TCAGTCATTG TCCATTGCGT TAATAATCCT 1X4 0 

GTATCCCCTT TCGTTAAAGG GG CATATTCA TATAATGGAT GGTCATTAAT AATAATTCCT 1200 

10 GCCGCATGTG TAGATGTATG TCTTGGTAAA CCTTCTAACT TTTTACAAAT ACTGAACCAG 1260 

CGTTCATGTC GATGGTTTCG ATGTACAAAC TCTTTAAAAT CGTCAATTTG ATATGCTTCA 1320 

TCAAGTGTAA TTCCTAATTT ATGTGGGATT AAACTTGAAA TTTCATTTAA TGTAACTTCA 1380 

TCAAACCCCA TAATTCTTCC AACATCTCTA GCAACTGCTC TTGCAAGCAG ATGACCGAAA 1440 

GTCACAATTC CAGATACATG TAGCTCGCCA TATTTTTCTT GGACGTACTG AATGAC CCTT 1500 

TCTCGGCGTG TATCTTCAAA GTCAATATCA ATATCAGGCA TTGTTACACG TTCTGGGTTT .1560 

AAAAAACGTT CAAATAATAG ATTGAATTTA ATAGGATCAA TCGTTGTAAT TCCCAATAAA 1620 

TAACTGACCA GTGAGCCAGC TGAAGAACCA CGACCAGGAC CTACCATCAC ATCATTCGTT 1680 

TTCGCATAAT GGATTAAATC ACTTACTATT AAGAAATAAT CTTCAAAACC CATATTAGTA 1740 

ATAACTTTAT ACTCATATTT CAATCGCTCT AAATAGACGT CATAATTAAG TTCTAATTTT 1800 

TTCAATTGTG TAACTAAGAC ACGCCACAAA TATTTTTTAG CTGATTCATC ATTAGGTGTC 1860 

30 TCATATTGAG GAAGTAGAGA TTGATGATAT TTTAATTCTG CATCACACTT TTGAG CT AT A 1920 

ACATCAACCT GCGTTAAATA TTCTTGGTTA ATATCTAATT GATTAATTTC CTTTTCAGTT 1980 

AAAAAATGTG CACCAAAATC TTCTTGATCA TGAATTAAGT CTAATTTTGT. ATTGTCTCTA 2040 

35 ATAGCTGCTA ATGCAGAAAT CGTATCGGCA TCTTGACGTG TTTGGTAACA AACAT t TTGA 2100 

ATCCAAACAT GTTTTCTACC TTGAATCGAA ATACTAAGGT GGTCCATATA TGTGTCATTA 2160 

TGGGTTTCAA ACACTTGTAC AATATCACGA TGTTGATCAC CGACTTTTTT AAAAATGATA 2220 

40 

ATCATATTGT TAGAAAATCG TTTT A ATAAT TCAAACGACA CATGTTCTAA TGCATTCATT 2280 

TTTATTTCCG ATGATAGTTG ATACAAATCT TTT AAT C CAT CATTATTTTT AGCTAGAACA 2340 

ACTGTTTCGA CTGTATTTAA TCCATTTGTC ACATATATTG TCATACCAAA AATCGGTTTA 2400 

ATGTTATTTG CTATACATGC AT CAT AAAAT TTAGGAAAAC CATACAATAC ATTGGTGTCA 2460 

GTTATGGCAA GTGCATCAAC ATTTTCAGAC ACAGCAAGTC TTACgGCATC TTCTATTTTT 2520 

AAGCTTGAAT TTAACAAATC ATAAGCCGTA TGAATATTTA AATATGCCAC CATGATTGAA 2580 

TGGCCCCTTT CTATTAGTTA AGTTTTGTGC GTAAAGCTGT AGCAAGTTGC TCAAATTCAT 2640 
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CAATATCATT AATAATCAAT TGCCCTTTAG AACGTAATCG ACATCTGATT TCATTACCTT 2760 

CATCGACTGC AAATACCCAT ATTTTCAAGC CTTTGATGTC AGCAATTGTA TTAACAAACT 2820 

GAGATGCTTC ATTTGGCTGA ATACCGAATT GCTCCAATAC ATCTTCAGTT ATTTTAACTT 2880 

GGCAGAATCC ATCATCCATA AGTTCGAAAT GTTGTAAAAC ATAACCTTGA AACGGCAACA 2 94 0 

TTTTTGGGTC CTTCTCCATC ATTTTATTTA AAAGCGCATT ATGATCAATA TCATGCCCAA 3000 

TTAACTTTCC AGCAATTTCC ATAGTATGTT CTGAGGTATT GTTAAAAAGG AATGGCCCAG 3060 

TATCACCGAC GATACCAAGA TATAAAACGC TCX3CGATATC TTTATTAACA ATTGCTTCAT 3120 

CATTAAAATG TGAGATTAAA TCGTAAATGA TTTCACTTGT AGATGACGCG TTCGTATTAA 3180 

CTAAATTAAT ATCACCATAC TGATCAACTG CAGGATGATG ATCTATTTTA ATAAGTTTAC 3240 

GACCTGTACT ATAACGTTCA TCGTCAATTC GTGGAGCATT GGCAGTATCA CATACAATTA 3300 

20 CAAGCGCATC TTGATATGTT TTATCATCAA TGTTATCTAA CTCTCCAATA AAACTTAATG 3360 

ATGATTCCGC TTCACCCACT GCAAATACTT GCTTTTGCGG AAATTTCTGC TGAATATAGT 342 0 

ATTTTAAACC AAGTTGTGAA CCATATGCAT CAGGATCTGG TCTAACATGT CTGTGTATAA 3480 

25 TAATTGTATC GTTGTCTTCG ATACATTTCA TAATTTCATT CAAAGTAGTA ATCATTTTCA 354 0 

TACTCCCTTT TTTAGAAAAG TTGCTTAATT TAAGCATTAG TCTATATCAA AATATCTAAA 360 0 

TTATAAAAAT TGTTACTACC ATATTAAACT ATTTGCCCGT TTTAATTATT TAGATATATA 366 0 

TATTTTCATA CTATTTAGTT CAGGGGCCCC AACACAGAGA AATTGGACCC CTAATTTCTA 3720 

CAAACAATGC aAGTTGGGGT GGGGCCCCAA CGTTTGTGCG AAATCTATCT TATGCCTATT 378 0 

TTCTCTGCTA AGTTCCTATA CTTCGTCAAA CATTTGGCAT ATCACGAGAG GGCTCGCTAC 384 0 

TTTGTCGTTT TGACTATGCA TGTTCACTTC TATTTTGGCG AAGTTTC TT C CGACGTCTAG 390 0 

TATGCCAAAG OGCACTGTTA TATGTGATTC AATAGGTACT GTTTTAATAT ACACGATATT 396 0 

TAAGTTCTCT ATCATGACAT TACCTTTTTT AAATTTACGC ATTTCATATT GTATTGTTTC 4020 

TTCTATAATA CTTACAAATG CCGCTTTACT TACTGTTCCG TAATGATTGA TTAAAAGTGG 4080 

TGAAACTTCT ACTGTAATTC CATCTTGATT CATTGTTATA TATTTGGCGA TTTGATCGTT 4140 

45 AATTGTTTCA CCCATCTGAG GCTGTCTTCC TAAAAGTTGC ATAGACTTTA AAACATCTTG 4200 

TCTATTAATC ACACCCAGTG TCTTTTTATT ACTCGAAACG ACAGGAATCA ATTCAATACC 4260 

TTCCCAAATC ATCATATGCG CACAACTTGC TACTGTACTC ATAGCATTTA CATAAATAGG 4320 

SO ATTTCGCGTC ATCACTTTAT CTATTTCGTC GTCGTCCTTT GTATTAATCA TCTCTCGACT 4380 

TGTTACAATA CCTACTAATT TATACGACTC ATTGACTACC GGAAATCTTG TATGGCCAGT 444 0 
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ATCTAATGGC 


GTCATTATAT 


CTTGAACTAT 


TAAGATATCT 


TTTCGTATTT TCTGATTAAA 


4560 




AAGTGCTTTG TTGATAATAT TTGCAACTAG GAATGTATCA TAACTTGATG ATAGAACAGG 


4620 


5 


TAAATCATGT TCATTCGCAA AATTAATAAC TTT ATT AG AT GGCTTAAATC CACCAGTAAT 


4680 




TAATATAGCC 


GTACCTCTTT 


TTAAAGCTTC 


AATCTGCACA 


TCTTCACGAT 


TTCCGACAAT 


4740 




CAATAATGTC TTTGGACCAA TATACTTTAA AATATCTTTG AGTTCCATTG 


CTCCAATTGC 


4800 


10 


AAATTTAGAT 


ACCATCTTAG 


TGATACCTTT 


GTTGCCACCT 


AACACTTGGC 


CATCAATAAT 


4860 




ATTGACAATT 


TCATTAAAAG 


TTAAATGTTC 


AATTTCATTA 


CGATTACGTT 


TTTCGATTCG 


4920 




AACCGTACCA ACACGATCTA 


TCGTTGOGAC 


CATGCCCATT 


TTATCAGCAT 


CTTTmATTGC 


4980 


15 


ACGATATGCT GTCCCytCaG ATACGTTTAA AAATTTAGCG 


ATTTTACGCA 


CCGAAATTTT 


5040 




AGAGCCTATA 


GATAACGATT 


CAATATAATG 


TAAAATTTGT 


TCATGTTTTG 


TGATTCTTTA 


5100 


20 


CCTCTTCTTT 


TCGAACAGTA 


TTAACTACAT 


TATAACTTTA 


TTTTGGATAA 


AAAGCATTGA 


5160 


AGTGAAATGA 


AATAATGATC 


GTTtCACCTA 


TTTTATTTTT 


TGAAAATATA 


CAACAAACAC 


5220 




AAAGATCACA 


AAATCTTTAA . 


TTTTAAATGG 


AAAAATCCAT 


TATTATTTAT 


TAGAATGTAA 


5280 


25 


GTGAGGAGGG 


ATGTACTAAT. 


GTATAAAAAT 


ATATTACTTG 


GTGTAGACAC 


TCAGTTAAAA 


5340 




AATGAAAAAG 


CACTAAAAGA 


AGTGTCTAAA 


TTAGCTGGCG 


AAGGTACAGT 


CGTAACAGTT . 


5400 




TTAAACGCAA 


TCAGCGAACA 


AGaTGCTCAA 


GCATCAATTA 


AAGCAGGTGT 


TCATTTAAAC 


5460 


30 


AAACTTACTG 


AAGAACGAAG 


CAAGCGATTG 


GAAAAAACAC 


GCAAAGCTTT * AGAAGATTAT - 


5520 




GGTATTGATT 


ATGACCAAAT 


AATTGTTCGT 


GGTAATGCAA. 


AAGAAGAACT 


ATTAAAACAT 


5580 




GCTAATAGCG 


GTAAATATGA 


AATTGTTGTT 


TTAAGTAACC 


GTAAAGCAGA 


AGACAAAAAG 


5640 


35 


AAATTTGTAC 


TTGGAAGTGT 


CAGCCACAAA 


GTAGCAAAAC 


GTGCGACTAT .CCCTGTATTA 


5700 




ATCQJTAAAT AAAATTTTTA 


TCCAGAATCA 


CAAATAATCT 


TTCAATCATG 


ATGCAGTCTC 


5760 




AAACGACTGA 


GTAAATACAA 


GAAACGATTA 


TGACTGTGGT 


TCTGGATTTT 


TTATATCGTA 


5820 


40 


GTAAATTTAT 


AATCAATGTC 


TAATTGTATA 


AAACTAAAAT 


TACGAGAGTA 


GGTCAGAAAT 


5880 




GATAAAGAAC 


CACTGATGTC 


CCCCGTCCAC 


GTCGTAACTG 


AATCAGTAGA 


ATATAAAAAG 


5940 


45 


ACCCACTAAA 


AATATGCAGA 


CGATAACTTC 


CACATAGATT 


AG CGAGGTGT 


TTTTTAGTGT 


6000 


AAAAT CT AT A 


TTCTATTTAA 


AACTGAACAG 


ATTCACCTGG 


TTTTAAAATT 


TGCACGTCCG . 


6060 




■ CTACATTAAC 


AGCATCTTTA 


AATTGTTGTG 


GATCTTGTTC 


GATTAATGGG 


AATGTATCAT 


6120 


50 


AATGAATCGG 


TACAGAAATT 


TTTGGTTTAA 


TAAATTCATT 


AATAGCATAA 


CTTGCATCAT 


6180 




CAATACCCAT 


CGTAAAATTA 


TCTCCAATTG 


GTACAAAACA 


TACATCAACT 


GGATGACGTT 


6240 
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TTCAACTTCA AACACGATAC 


CCATTGGCAT ACCTAAATAA ACTGGgAATA CCATTTTCAT 


6360 




GTGTAAAACT 


1 TGAACTATGA 


AATGCTTGAA 


, CAAATTTAAC 


GCTTCCGAAA 


TCAAaGTTTG 


6420 


s 


CTTTACCACC 


AaTATTCATA 


CCATGAACAT 


TTTCAACACC 


GTGATATGAA 


GAAAGATAGT 


6480 




CAGCCATTTC 


TGCACTTCCA 


ATTACTGTTG 


CTCCTGTTTT 


CTTTG CTAGT 


TCCACAACAT 


6540 


10 


CACCAAAATG 


ATCAAAATGA 


CCGTGCGTTA 


AAACGATATA 


GTCTACCTGC 


ACTGTTTGAA 


6600 


TATTCAAATC 


ACACTTAGGG 


TTATTTGAAA 


TAAACGGATC 


TACGATAACC 


TTTTTGTTGT 


6660 




TCCCTTCTAA ATAAATCGTT 


GATTGACCAT 


GAAATGATAA 


CTTCATTTGA 


GCATCCTCCT 


67*20 


15 


ATCAATTACT 


ATATAAATTT 


AGTACCCTTT 


TGCCACTTAA 


TTATAACAAA 


TTCTCAAATT 


6760 


TTAAAAATTG 


AAAAT CTAGT 


TAATGTATTA 


GCTCGATTTT 


GAAATCtAAT 


AATAATTGGC 


6840 




ATAAAATGGA AGTAATATTA 


TGTTGAGGAG 


TGTTTATAAA 


ATGACAAAAA 


TATCAAAAAT 


6900 


20 


AATAGACGAA 


TTGAACAATC 


AACAAGCTGA 


TGCAGCATGG 


ATTACAACAC 


CGTTGAATGT 


6960 




ATATTATTTT 


ACTGGATACC 


GTAGCGAACC 


CCATGAAAGA 


TTATTTGCAT 


TATTGATTAA 


7020 




GAAAGATGGT 


AAACAAGTAC 


TATTTTGTCC 


AAAAATGGAA 


GTCGAAGAAG 


TCAAAGCATC 


7080 


25 


ACCTTTCACA 


GGTGAAATCG 


TTGGATATTT 


AGAGACTGAA 


AACCCTTTTT 


CACTTTATCC 


7140 




TCAAACAATC 


AATAAATTAC 


TAATTGAAAG 


CGAGCACTTA 


ACAGTAGCAC 


GCCAAAAACA 


7200 




ATTAATCTCT 


GGTTTCAATG 


TCAATTCATT 


CGGAGATGTT 


GATTTAACAA 


TCAAACAATT 


7260 


30 


GAGAAATATT 


AAATCCGAAG 


ATGAAATTAG 


CAAAATACGT 


AAAGCTGCTG 


AGTTAGCAGA 


7320 




TAAGTGTATC 


GAAATAGGTG 


TTTCTTATTT 


AAAAGAAGGT 


GTGACTGAAT 


GTGAAGTAGT 


7380 




GAACGATATT 


GAGCAAACTA 


TCAAACAATA 


TGGCGTCAAT 


GAAATGAGTT 


TTGATACGAT 


7440 


35 


GGTTTTATTT GGAGATCATG CCGCATCACC TCATGGCACA CCAGGAGATC GCAGATTAAA 


7500 




AAGCAATGAA 


TATGTACTAT 


TTGATTTAGG 


TGTAATTTAT 


GAGCATTATT 


GTAGCGATAT 


7560 


40 


GACACGTACT 


ATTAAATTTG 


GTGAACCTAG 


CAAAGAAGCA 


CAAGAAATTT 


ATAATATTGT 


7620 


ATTAGAAGCA 


GAAACATCTG 


CAATCCAAGC 


AATTAAACCT 


GGAATACCAT 


TAAAAGATAT 


7680 




CGATCATATC 


GCTAGAAATA 


TTATTTCAGA 


AAAAGGTTAT 


GGTGAATATT 


TCCCTCATCG 


7740 


45 


CTTAGGTCAT 


GGCCTAGGAT 


TACAAGAACA 


TGAATATCAA 


GATGTTTCAA 


GTACTAATTC 


7800 




TAATTTGTTA 


GAAGCTGGGA 


TGGTTATTAC 


AATCGAACCA 


GGTATTTATG 


TACCTGGTGT 


7860 




TGCAGGTGTA 


AGAATTGAAG 


ATGACATACT 


TGTCACTAAT 


GAAGGATATG 


AAGTATTAAC 


7920 


50 


AGATTACGAA 


AAATAAGGAG 


TGGGATAAAA 


ATGAAAAGCT 


TGTTACAAGC 


GCATTCTCAT 


7980 




TCAGTCAAAC 


ACTGCCAATA 


TAACATTGTA 


GCGCCTAAGA 


CAT AAA l" 11 a 


TATCCAAGTC 


8040 



55 



714 



EP0 786 519 A2 





TGTAATGAAT 


CAAATCAATA 


TCATTCATGT 


TCGATGATTT 


CTTCGCATTG 


TTTCTAGCTT 


8160 




TAATTTATCA 


TTATTTAATT 


TTAATAACCA 


AGGAGATGAT 


AACGTCATTC 


TTTAGTACGC 


8220 


5 


* TGTAATCCAT 


TCCCTTTTCA 


TCAAATTCAA 


ATTATAATTG V 


TAATGCTTCT 


TCTACAGATT 


8280 




TATATTCCAT 


TTCAAATGCC 


TCTGCAACGC 


CTTTATTGGT 


TACGTGACCT 


TTGTAAGTAT 


6340 




TTAAACCTAA 


TGATAATGGT 


TGATTTGATT 


TAAATGCTTC. TCTATACCGT 


TTATTAGCTA ^ 


8400 


10 


GCATGAGCGC 


ATAAGGTAGC GTAgCATTAT 


TTAAAGCTAA 


CGTCGAAGTA 


CGCGGTACTG 


8460 




CACCTGGCAT 


ATTTGCAACT , GCATAATGAA 


CCACACCATG 


CTTAATATAT 


GTAGGATCAT 


8520 


15 


CATGTGTCGT 


AATTTTATCA 


GTTGtTTCAA 


AAATACCGCC 


TTGATCAATA 


GCAATGTCAA 


8580 


TAATAACTGA 


CCCATTTTTC 


ATTTGTTTAA 


TCATGTCTTC 


TGTTACAAGT 


CTTGGCGCTT 


8640 




TAGCACCTGG 


AATTAAAACT 


GGACCTATTA 


CTAAATCACT 


TTGTTTAACA 


TACAACTCAA 


8700 


20 


TATTCAACGG 


ATTTGACATA 


ATTGTATGTA 


CACGTCCACC 


GAATAAATCA 


TCTAATTGTT 


8760 


GTAAACGCTT 


TGGATTAACA -TCTAAAATGG 


TAACATCTGC 


AGCTAGTCCT 


AGTGCAATTT 


8820 




TAGCTGCATT 


TGTTCCTGCT 


TGACCACCAC 


CGATAATAGT 


TACTTTACCC 


TTAGGTACTC 


8880 


25 


CTGGGACACC 


ACCTAGTAGA 


ATTCCCATAC 


CACCATTAAG 


TTTTTGTAGG 


AACTCTGCGC 


. 8940 




CAACTTGAGC 


TGACATTCTT 


CCTGCTACCT 


CACTCATTGG 


TGATAACAAT 


GGTAAAGATC 


9000 




GGTCTGGTAA 


CTGCACAGTC 


TCATATGCAA 


TACTAATTAC 


TTTTCTATCT 


ATCAAAGCTT 


9060 


30 


GTGTTAATTT 


TTCTTCATTT 


GCTAAATGAa 


ga t AaGTGAA T AAT ACAAG C ' 


CCTTCTTTAA 


9120 




AATATGGATA 


TTCAGATTCA 


AGTGGTTCTT 


TAAGTTTAAT 


AACCATATCC 


ACATCCCAAA , 


9180 




CTTTTGCTTG' 


TTCAGCAACA 


ATCTCAGCAG 


CTGCTTCTTT 


GTAATCTACA 


TCTTCAAAGA 


9240 


35 


ATGATCCTGA 


ACCCGcATTT 


GTTTCCACTA 


AAACAGTATG 






9280 



(2) INFORMATION FOR SEQ ID NO: 132: 

(i) SEQUENCE CHARACTERISTICS: 
40 (A) LENGTH: 4669 base pairs 

■ (B) TYPE: nucleic acid * 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 132: - 
CTGATTAATC TCTTGTTGTC GTGTATTTAC TAATTGAATC GTTGGTGTCT GAACACGTCC 60 
so CAGGGATAGC TGTGCATCAT ACTTTGTTGT TAGTGCACGC GTTGCATTAA TCCCAACAAT 120 

CCAATCTGCC TCACTTCTCG CTAACGCTGC ATAATACAAA TCGTTATATT GACGACCGTC 180 
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ACGGATTGGC TTTTTGTTAC CAACTTTATC CAAAATCAAT CTTGCAAGTA GTTCACCTTC 300 

TCGTCCaGCA TCTGTTGCAA TAATAATATC TTTCACTTTA TTATCTAAAA TTAACGCTTT 360 

TACTGTTTTA AATTGTTTGC TTGTTTTACC AATAACAACA GTTTTCATAT ATTTAGGTAT 420 

AATTGGAAGG TCTTCTAATC GCCATTCCTT TAAATTTTTA TCGTATTGTT CAGGTGTCGC 480 

ATTTGTCACT AGATGACCTA ACGCCCACGT GACAATATAT TGGTTATTTT CAAAGTAACC 540 

ATTACGCTTC TGATTTATTT GTAAAGCATC AGCAATATCT CTTGCGACTG ATGGTTTTTC 600 

AGCTAATATT AAAGATTTCA TAAATTATCC TTTCTCATAC GTTCTTTTAT TTCGAACGTG 660 

CTTCATCTAT TCCACTAATC TTTGATTTAA ATTCAATGAT TGCAAATGAT GTGTTAAATG 720 

TATTGTAACA TGTTAATATC ACTATTAACT TTCATTTCAG TTGAAATACT ATATAATAAA 780 

AGTAACAAAA AGTACGGAGG TAATGACATG AGCATAGTTC AGTTATATGA TATTACACAA 640 

ATAAAATCGT TCATTGAACA TTCGAATTAT GAATCAG CAT CATACTTATA TAAACTTCCT 900 

CAACAGTACA ATGAAATAGA TGTATTAATA ACCGATGCGA TTGAATCACC TGGTGTATTT 960 

TCGATTAAAG AAAACGATTC AATCAAAGCA ATCATATTGT CTTTTGCATA CGATAAAAAT 1020 

2S AAATTCAAAG TCATAGGCCC TTTCGTGGCT GACAATTATG TATTATCTGT CGATACGTTT 1080 

GAAACGCTAT TTAAAGCAAT GACTTCGAAC CAACCTGACG ATGCCGTCTT TAACTTTTCT 1140 

TTTGAAGAAG GCATTCAACA ATACAAACCA TTAATGAAAG TTATTCAAGC AAGTTATAAC 1200 

30 TTCACTGACT ATTACATAGA AGCCCGTACA AGATTAGAAG AAGATATGCA CCAACCAAAT 1260 

ATCATTCCTT ATGACAAAGG GTTTTATCGT GCTTTCAGCA AATTACACAC AACTACATTT 1320 

AAATATGAGG CACAGTCACC AGAAGATATC ATTGATAGTT TAGACGACCA T CAT CATTTG 1380 

TTTTTATTTG TTAGCGAAGG TTTACTTAAA GGTTATTTAT ACCTTGAAAT TGATTCACAA 1440 

CAGTCAATCG CCGAGATTAA ATACTTCAGT TCTCATGTAG ATTACCGTTT GAAAGGTATC 1500 

GCTTTCGAGT TGCTTGCGTA TGCATTGCAA TATGCTTTTG ATAATTTTGA TATTAGAAAA 1560 

GTTTATTTTA AAATTCGTAA TAAAAATAAT AAACTCATCG AACGATTTAA TGGTCTAGGT 1620 

TTCCATATCA ACTATGAGTA GATTAAATTC AAATTCGAAT CACGTAACGT AAAAGATCAA 1680 

ACAATCCCTG AATAAAACAC CAAGCAAATA GGCTACAGTA CATCATTAGC ATGTATTGTG 1740 

GGTTTTTCTA CTTTTTGTAA ATATTGAAAA TTATAAGTAG TTGTTTTTTA CTATTAGGGC 1800 

AGAATGCTTT ACAATAACAT GCAAGTGTCA ATTAAGGGGA GCACTTGCAT AAATAGTATA 1860 

SO GGAGAGTGAG TAGTCTTGCA ATTTCTTGAT TTCTTAATCG CACTTTTACC TGCTTTATTC 1920 

TGGGGAAGTG TCGTTCTTAT TAATGTGTTC GTCGGCGGTG GACCTTACAA CCAAATTCGT 1980 



55 



35 



40 



45 



716 



EP 0 786 519 A2 



1S 



20 



TTCAATAATC CTACTGTAAT TATTGTCGGT CTTATTTCTG GTGCATTATG GGCGTTTGGA 2100 

CAAGCGAATC AGCTTAAATC TATTAGTTTA ATCGGTGTAT CAAATACTAT GCCAGTTTCT 2160 

5 ACAGGTATGC AATTAGTTGG TACAACATTA TTCAGCGTTA TCTTTTTAGG TGAATGGTCT 2220 

TCAATGACTC AAATTATCTT TGGTTTAATC GCCATGATAT TATTAGTTAC TGGTGTAGCA 2280 

CTTACTTCAC TTAAAGCTAA AAATGAACGT CAATCAGATA ATCCTGAATT TAAAAAAGCA 2340 

10 ATGGGTATTT TAATTGTATC TACAGTTGGA TATGTAGGTT TCGTTGTACT TGGTGACATC 2400 

TTTGGTGTTG GTGGAACTGA TGCATTGTTC TTCCAATCTG TCGGTATGGC AATTGGTGGC 2460 

TTTATCCTAT CCATGAATCA TAAAACATCA CTTAAATCAA CAGCACTTAA TCTATTGcCA 2520 

GGTGTGATTT GGGGAATTGG TAACTTGTTC ATGTTCTATT CTCAACCAAA AGTTGGTGTA 2580 

GCTACAAGTT TCTCATTATC ACAGTTACTT GTTATCGTTT CAACCTTAGG CGGTATTTTC 2640 

ATTTTAGGAG AAAGAAAAGA TCGTCGTCAG ATGACGGGTA TTTGGGCAGG TATTATTATT 2700 

ATCGTGATAG CTG CTATAAT TCTAGGTAAT TTGAAATAGA AAGTTAAATA CTCATGTAAC 2760 

GTAAAAATGT AATCACTTCT GAAAATAACC ATTCACTTAT AGAATGATTA AAATTAATTT 2820 
25 ' TCGGGAATTT TACGTTGAAT GTTCCTCTAT ATGTCCTAGG AAATACGTGG CTCTAAAAAC 
AAAACGCAAT AACACATCAT GACATTAATC ATGCGTTTTA AGACTTTAAA ATTAGCGATA 

CTTTTAAAAT CTTGATGATA TTCATATATC AAGTATGCGC CATACATATG AAGTGGATAG 3000 
30 CTGCATAACG CACTGCATTA TCAACTTGAA TGTATGAGTT GAACAACTAT GTCATAAATA 
AAAGCCCCCT TTTCACAATA TACATTTACA TATTGTGGTA AAGGGGGCTC TCATTTTCTA 

CGAATACTAA AATGGATTTT ATTTTCAAAT GTGTAAACTA GACAAACACT GCCTGATACA 3180 

35 CGTACAAAAT AATGATACTA ATAATGATTG TCAAATTGGT CGTCATACCT. ATAAATGGCA 3240 

GTGTTCGATA TTTAAACTGA AT AC CAT AAG AAATAATTGC AACACcTACC GGGAACATCC 3300 

AAGTGACCAA CAATGTCGTC TTAATCATAT CATCTGATAC TGGTAACAAG ACATATACTA 3360 

40 

ACAATCCCGC AACTAATGCT AATCCATAAT GCAAACATAA ATATTTAATA GTAGCAGGTA 3420 

TATACTTTCT TTCCAGAGTA AAATTCAACA TGACACCTAG CAAAATCATT GATAACGGCA 3480 

45 TATTTGCATG GGAAAGTATG' CTAAAGAAAT CGATTGCCAC ATGTGGTAAA TGGATGTGAC 3 540 

TTATATTCAA TATAAACATT ACAATGTATG TAACGAGTGG CACTGATTGT AATAATTTCT 3600 
TACCTAAATA TTTAAAATCG AATTGATCAC TACCTTCACT AAAGTAGCTA CCTACAAAGT 3 660 

50 AAGTAATTCC AAACATCACA AAGGCACCAC CTATATCAGC CATAACAAAA TAAATAAGTC 3720 

CCGTTTTAGG CCATATCACT TCAATTAGTG GATATGCAAA CAATCCAATA TTCATAGCAC - 3780 



2880 
2940 



3 060 
3120 



55 



717 



10 



15 



20 



35 



45 



EP 0 786 519 A2 

CAATCATTTT CGCCACAATA CCATATATAA TCATTAAAAT TGGTAAAATG GAGAATGACA 3900 

ATTTTAATTC TGCACTGTTT AAATTCACAA TAACTAAAGA TGGGAGTGTG ACATTAAGAA 3960 

CTAATGTAGC AATGACTTGA CTATCTGTTG CTTTTATAAA ATTAATGCGC TTCAAAAAGT 4020 

AACCAAGCGC AATTAATAAA ATAATCATAG TAAATTGTTC TGTCACTGTT ATCCCTTCTT 4080 

TCAATAATCT TCATAATTTA TAACTTTAAC ATACTCCACA GATATTTTAG AAGTCTACTG 414 0 

TTTCATGCTA TAATCTACAT TAAATGCACT TAATTATATT TCAAAGGAGT GTTATAGTAT 4200 

GTCTTTAGAA AACCAACTAG CCGAACTTAA ATATGATTAT GTTCGTCTTC AAGGTGACAT 4260 

AGAAAAACGG GAATCTTTGA ATTTAGATAC TTCCGCACTT GTTCGTCAAC TTAAAGATAT 4320 

TGAAAATGAA ATTAGAAACG TTCGTGCTCA AATGCAAGAT TAATAATCTA TCATTCAAGC 43 80 

AATAAATGCT TTTTGTTACA TAAATTTGAC TAG CATTGCT CTGAATACGT TATATTGATG 4440 

AATTGCTTCA TTTTTCGCTC AATTACATCT AGAATCACAA GATGTTGTCG TGTTATGATT 4 500 

TAGTGTTTCA TTAACAACAT ACACGCATAT CTATCCCAAC ACTGCTATTT ATGTTTTCTA 4560 

CGCTGnTGTA CTACATGAAC CCTTTGAAAC GGAGAGGAAG TTATCATATG CAATTTTAnC 4620 

TGATTTTACT AGCAATACTT TAACnAATTG nTAGTTTAAT AGAATTTTA 4 669 
<2) INFORMATION FOR SEQ ID NO: 133: 

<i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2785 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D> TOPOLOGY: linear 

^(xi),- SEQUENCE DESCRIPTION: SEQ ID NO: 133: 

TTTOCACCCA TCTGaTACAA TGCACCATGC GGTTTAACAT GATTAATTTT AACTTGATGA 60 

ATGCGACAAA ACCCTTGTAA TGCACCTAAT TGATAAATCA TCAAATTATA AATCTCGTCG 120 

TTAGAGATAT CTATATTTCG TCTGCCAAAG CCTTTCAAAT CAGGTAAACC AGGATGTGCA 180 

CCTACTGCAA CATTATGTGC TTTGGCAAGT TTTACCGTTT CATTCATTAC ATTTTCATCA 24 0 

CCAG CGTGAA AACCACAAGC AACATTCGCA CTTGTAATTA ACGGAATAAT TTGATGATCA 300 

CCACCAAAGG AATAATTTCC AAATGCTTCG CCTAAATCAC AATTCAAATC AACTCGCATT 360 

ATAAtTCCAC CCCTTTAACA ATTTGATGTT TTTCTAAAAA TTTAATATCA ACATCTTTTG 420 

CATCTCCATC ACGATATAGT GGATAATTTA AAACTGCATA TAAAAAATCG GCAGTTGTAG 4 80 

AAAATCCATC TATCACCATT TCATCTAAGG TGACTTTCAA CTTATCAATT GCTGAAGCTC 540 
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AACCGTGATA TAGTAAAGAA TCGACTCGCA 
TCACTTTACC TGGTGTTGGT TGAAATTTCT 
5 CTATCACATG ACCATTAAAT TGAATATCGC 

ATAAATACAG TTGTGCTGCA ACCAAATCAC 

CAACTTGTAT TCGAGCATTC ATTTCAATAA 

10 

CAATCGTACC TGCACTTCTA TAATTTGCTG 

TTTGTTGTCG TCTTTCTTCA GTTAATGCTG 

TTTTACGTTG TACAGAACAA TCACGTTCCC 

15 

CCaTAACTTG AACTTCAACA TGTTTTGcAA 
CATCATCAAA GTATTTTTTT CCTTCACTTT 
CAGCTTTCTT TACAATACGT ATACCTTTAC 

20 

CTGGATAACC GATGTCTTTG GCAAGATTCT 
TTGATCCTGG AATCACAGGA ACACCTGCAT 

25 CCCCCATCAT TTCCATCGTT TTTTTAGTAG 

CGGTTTGAGC AAATTTTGTT GATTCTGATA 
CACCAGTGAT TTGTGCAGCA GATATGATGC 

30 TArcwTCCCC AATACATATA G CTTGATCTG 

CTTTTGCATA AACTGCTACA GTTTCAATCC 
CAGCAATTTC ACCTCTGTTC GCAATTAAAC 

35 ATACGTACCA AAACTTGGTC GTATTCAACA 

ATITCCTCCAG CAACATCTGT TGTTACCTCG 
AT AAT AT CT C CCTTGTTAAC TTTGTCACCG 

40 

CTATCTTGTA AAAAGAATGT ACCTATCATT 
GAAACATCGG AGTTATCATT CGCTTTTGAA 
TTTGATTGAT TACTGTGTGC AGCCAAATGA 

45 

TCTTCAAAAT TTTTATATTT AAATTTCTTA 
TGTTCGATTT nTTCAATATT CATTTTACAA 
50 CGAAGTATGT CGCAAGCTAG ATGTATCAAA 

TTCATTAAAC AGAGACATTT GTTCCCGATT 

55 
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TGTCATGATA 
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1980 
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CATTATTGTT 
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2040 


TTCGAGTCAG 


TGAAGTCAAT 


TTCTATTTCA 


2100 


ACATCATTTT 


CCTTCACTAA 


TTTGATTATT 


2160 


ATCCCCTTTT 


AAAATTGTTG 


CTAATTTTTT 


2220 


AATTGGAGTC 


TTTTGATGAC 


TCTTAAGAAT 


2280 


CTTAT CTACA 


GCTTCTTGGA 


ATGATATCCA 


2340 
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TACAGTTGCA ATTTTGGTAT AACCACCTAT CGTTTGTTTA TCATTAAGCA GAATAATAGG 24 60 

TTGACCATCA TTTGGTACCT GAACACTACC AAGAGCAACC GGTTCAGAAA TGATATCTGC 2520 

TTGATTAAtT GGTGCAACGC TGTCACCTTC CAAACGATAG CCCATACGGT CTGATTGTTC 2580 

AGTAATTAAA TATGGATGAT TTACAATTTT CGCTCTAGCC TCTTCAGAAA ATGCCTCGAA 2640 

TTGAGOTCCT TGAAGAATGT GTATAATATT ATTTTCTGGC AATAAATCGT CCTGTAAATG 2700 

AATCGTCTTT CCAATGTTTT CTTTAAAGTC ATTATTTATT TTCACTGTTA TTACATCATC 2760 

AGCTAATAAC TTTCTACCTT TGAAT 2785 
<2) INFORMATION FOR SEQ ID NO: 134: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1010 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 134: 
25 AATGGAAACG GTTGAAACAG CAATTATTAC TATTTCTATG GGTGAAGGTA TTTCAGAGAT 60 

ATTTAAATCA ATGGGTGCCA CACATATCAT TAGTGGTGGA CAAACGATGA ATCCTTCTAC 12 0 

AGAAGATATC GTTAAAGTCA TTGAACAATC AAAATGTAAA CGTGCAATTA TTTTACCGAA 180 

30 TAATAAAAAT ATCTTAATGG CAAGTGAACA AGCAGCGAGT ATTGTTGATG CAGAAGCTGT 24 0 

TGTTATTCCA ACGAAATCTA TTCCTCAAGG TATAAGCGCA CTATTCCAAT ATGATGTGGA 3 00 

CGCAACACTT GAAGaAAATA AAGCGCAAAT GGCTGATTCA GTAAATAACG TTAAATCTGG 3 60 

TTCATTAApG TACGCTGTTC GTGATACGAA AATTGATGGC GTTGAGATTA AAAAAGACGC 420 

GTTTATGGGC TTGATTGAAG ATAAGATTGT AAGCAGCCAA AGTGATCAAT TAACAACGGT 4 80 

TACTGAGTTG TTAAATGAGA TGTTAGCAGA AGATAGTGAA ATATTGACTG TGATTATTGG 540 

TCAAGATGCA GAGCAAGCAG TTACAGATAA CATGATAAAC TGGATCGAAG AGCAAT ATCC 600 

AGATGTAGAA GTGGAAGTTC ATGAAGGTGG ACAACCAATT TATCAATATT TCTTTTCAGT 660 

AGAATAAAAA TTTAAAATAA AAAACTACCA ATGATAAATC ATCAGTTGGT AGTTTTTTAT 720 

TTTG CTATTT TAGTGATATT GCGGGTTAAA AGTATCGTTC TCGAGTTGCT AACAATGTCA 780 

TGTTCAACTT AGTCATGATA AAATAAATAA CATACTAAAT GATACGTAAA ATCAAATAAA 840 

50 ACATAGGTGA TTTATTTTGG CTAAAGTAAA CTTAATAGAA AGTCCATATT CTCTTTTACA 900 

ATTAAAAGGT ATAGGTCCTA AGAAAATAGA AGTATTGCAA CAACTAAATA TTCATACAGT 960 
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(2) INFORMATION FOR SEQ ID- NO: 135: • 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1540 base pairs 
5 (B) TYPE: nucleic acid 

<C) STRAND EDNESS : double 
(D) TOPOLOGY: linear 

w 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 135: 

TGTAGTTGAA CATGAACAAC AAAAGAAAGA AAAGACAAAA AAGCAATACA AGCCATTTTG 60 

GATTGTCATG AGTTTTATAA TACTTATAGT TGTACTATTA CTCCCGGCAC CTTCAAGTCT 120 

1S 

GCCGATAATG GCTAAGGCAG TACTAGCTAT TTwAGCTTTT GCAGTTATTA TGTGGGTAAC 180 

GGAAGCTGTA TCATATCCGG TGTCAGCAAC TTTAATTATT GGCTTAATGA TATTACTTTT 240 

2Q AGGATTTAGC CCTGTTCAAA ATTTAGGGGA GAAGCTAGGT AATCCGAAAA GTGGCAGTGC 300 

TATTTTAGCT GGAAGTGACC TTCTAGGAAC TAATCATGCA TTATCATTAG CGTTTAGTGG 360 

ATTTGCAACT TCAGCTGTAG CTCTCGTTGC AGCTGCATTA TTTTTGGCTG CTGCTATGCA 420 

25 AGAAACGAAT TTGCATAAAA GACTAGCTCT TTTAGTGTTA TCAATTGTTG GTAATAAAAC 480 

TAGAAATATA GTTATTGGAG CAATTATCGT TTCAATTGTA CTTGCATTTT TCGTTCCTTC 54 0 

TGCAACAGCT AGAGCAGGGG CAGTTGTACC AATCTTGCTG GGTATGATTG CGGCATTTAA 600 

30 AGTTTCCAAA GATAGCAAGT TAGCGTCTTT. ATTAATAATT ; ACTTCAGTAC ^AAGCTGTGTC 660 

AATTTGGAAT ATTGGTATCA AAACGGCGGC AGCACAAAAT ATCGTAGCGA TTAATTTTAT 720 

AAACCATCAA TTAGGATTTG ATGTTTCATG GGGCGAGTGG TTCTTATATG CAGCGCCTTG 78 0 

55 GTCCATAGTT ATGTCCGTAG CTTTATATTT CATCATGATT AAAGTGATGC CTCCAGAAAT 84 0 

TAAT&CAATA GAAGGTGGTA AAGATTTAAT AAAAGAAGAA TTGCATAAAC TTGGCCCCGT 900 

TAGCCCACGT GAATGGCGTT TAATTGTTAT ATCGATGTTA TTATTACTGT TTTGGTCAAC 960 

40 

TGAAAAAGTA TTACATCCGA TTGACTCTGC ATCCATTACT ATTATTGCTT TAGGTGTTAT 1020 

GTTAATGCCG AAAATTGGTG TCATGACATG GAAACATGTT GAAAATAAAA TACCATGGGG 1080 

AACAATTATC GTGTTTGGTG TAGGTATTTC ACTAGGTAAC GTTCTTTTGA AAACAGGTGC 114 0 

45 

AGCTCAATGG TTAAGTGATC AAACTTTTGG TGTTTTAGGT TTAAAACATT TACCTATTAT 1200 

CGCGACAATT GCACTTATCA CGCTTTTTAA TATATTGATT CATTTGGGCT TTGCGAGTGC 1260 

SO AACAAGTTTA TCATCAGCGT TAATACCTGT TTTTATTTCG CTAAC CTCTA CGTTACACTT 1320 

AGGAGACCAG TCTATAGGAT TTGTTTTAAT TCAACAATTT GTTATTAGTT TTGGTTTCTT 1380 
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AGATTTCTTG AAGGCAGGTA TACCATTGAC AATTGTAGGG aATAtCtAgT GaTAGTTTTT 1500 
AGCATGACTT ATTGGAAATG GGTAAGGTTG CnTTAATTAA 1540 
* (2) INFORMATION FOR SEQ ID NO: 136: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 11823 base pairs 

(B) TYPE: nucleic acid 

0 (C) STRAND EDNESS : double 

CD) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 136: 

1S 

ACTTCTCACA ATAAGAAATA TGAAATTGTT ATGTGTTAGT TGAGATTCAG TGATGAATTA 60 

CTTTTATGAT TTAAAATGTT GTTATCATTG TCATGCGTTA CCAAATCGCT TACGTATACA 120 

CGATTCCCAA TCTTAACATA GAOGATTTGT ATATCAGAAT TTTCTGATTA CTAACAGTTT 180 

20 

ACCTAAGTTT AAATATCTGT TCAATGATTT TCAGTTATTT TTAAAAGAAA AATCGTAATG 24 0 

CTGCCATGAT AACAATCCCA CTAATAATTG TAATAGTTAA At ACGCGTGA TTATAGATAA 3 00 

25 AATAACCGTC GGAATGAGCG CGATAATGTA AGGGATGTTT AATGTATACC CCTCACCATG 360 

AGGCGTCTGT TGAATAATGC TGTCAATGAC AAGTGCCGTA AATAGTGTGA TTGGGATAAA 420 

TGATAGCCAT CGAACCACGA CATCAGGCAA TTGCACTTTT GAAATCATGA TAAAAGGTAT 48 0 

30 AATTCGAATT AATAGCGTTA CGATACCACA CAATAAAATA AGTATTAACA TGTTCATATG 54 0 

AGTTATCATT GTTCCATCAT CACTCCTAAC GCTGCTGAAA TTGTGGCTGC AATTAATATT 600 

GCTAGATATG AAGGCATAAA CATACTTAGC GATAACATCA TTACTATGAC GGCAATAATG 660 

35 AGTACTATGT AAATTCTTAA TCGCGATTTA GTAATTGATT CAAATTGCGC AATGGCCAAA 720 

AAGATAAACA TAGCCGTGAT AGCAAAATCT AACCCTAGCG TTTGCGGATT TGAGATATAT 780 

TCGCCAAATA AAGCCCCAGC TACACATGAA ATTGCCCAAA ATAAATATGC TGTGATGTTA 84 0 

40 

AGACCATGCA TCCAACGATC ATTGATAGCT TCTCCTTTTA AATAAGGTGT AATGGCGACG 900 

CCAAACGTTT CGTCAGTTAC TAATGAACCT AATCCAACAC GGTTCCAAAA CCCATATGTC 960 

TTGAAGTTTG GTGCAAGCGA CATACTTAAA AGGAACATTC TTGAATTTAC GATAAATACA 1020 

45 

GTTAGTACAA TCGCTGATAT AGGTGTACCt GCTATAAACA ACGCGCACAT AATAAATTGC 1080 
GCAgcaCCGG CATATATAAC AAGACATAAC AAGACAATTT CTAAAATACT AAAGTTTTGA . 1140 

so GACGAAGCCA CAATACCAAA TGAAATACCA ACACCGGCAT AACCCAATAA TGTTGGGATA 1200 

CACTCTTGCA CGCCTTGTCT AAAACTTAAA TGTGTTGTCA TCTCAATTAC CTCCTTTGCC 1260 
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TAAGCAATAA 
CTTCATATTA 
TTTTCTATGG 
TGAGTCTGGG 
CTCCATCGAT 
TATATTAGTG 
CGTATTGTTG 
GTTATGTGCA 
CACCACTTTT 
ATACTTTTTA 
CCACCCATAA 
TTTTCAACAA 
GCTAATTCTG 
AAATCCGTAC 
ACTTCTAAAT 
CGACGGTATG 
AAAGCATTCC 
TGTAAACGAA 
GCAGATTGAC 
AAATTCGTTA 
AATTgUVTCTT 
AGCTGTGGTA 
TTCATTAAAG 
GAAACTTTTG 
GCTTTGGGTT 
TCATCAGATT 
CCTGTCATTT 
AATGTGCGCA 
ATTTCTTCGC 



CATTAGACAT 

ACTTTTTATT 

aTTTGTAGTT 

aTATTGaTTC 

ATAACTCATA 

ATGCTCAAAC 

CTATAATGAA 

TTGGCTCACT 

TAAAATATTA 

AAGCTTGTAG 

ATGGTACTAA 

TAGCAGCAAA 

GTTTAGCTGC 

AGTTTGAGCA 

CATATGTTTT 

GTAAACCTAA . 

ATGAAT CTTC 

TTAATCCTCT 

CAGTGAATTT 

ATGGTACTTC 

CTTCAAATTT. 

CCATCATTTC 

CACGCTCTAA 

CTGCACGATC 

CAAATGAAAA 

CACCTTGAGG 

TATTATCAAT 

TTTCAGCAAT 

TTACTTTATT 



CAGTTTGTCT 
TTTGAGAATT 
GTTTTTAAGT 
ATGTACCACT 
CTACATATCA 
TTGTTACGTT 
ATGCGTTCAC 
ATTATATTTT 
TTTAAAGTAT 
CTAAAGCCTT 
TGCTTCTGGA 
TGTACGTCCA 
TTTGTCACGC 
TGAACTAATT 
GCTTG CACTA 
CTCTTCTAGA 
AGGTTGTTCA . 
TGTATCTCTA 
TTCAGGAAGT 
AGCAGTTGGA 
AGGTAATTGA 
TGTATAACCA 
TTGCGCACCT 
AAAATCAGCC 
CTCaCGTGGT 
TACATCATCA 
TTCATTTAAT 
CACATCATCA 
ACGACGTGCT 



GAGGTTAGAC 
TTCAATTTTT 
ATCAATTTTA 
CCCTTaTaAT 
ACGAAATCAG 
TTAGATTGTT 
CCCATTAAAC 
TACAGCACAA 
CTTGCCCTTG 
TATTTAACTG 
ATTGTTACTG 
ACTGCTAAAC 
TTGAAGCGGA 
TCTTTATAAT 
AATCCAATAT 
ATTGCTTCTG 
AAACGTACCA 
CCTGCTGATC 
ACACCTGGTT, 
ATTGTATATA 
CCTGTACCAT 
TGTTGTGTTG 
TCATTTGTTA 
ATTTTCAATT 
GTACCCCACT 
CTTATTAAAT 
TGACTATCTT 
GCATTTTCTT 
TTCATTTCTT 



ATTCOGGAGT 
TATTTAAGAC 
TAAATTTTTA 
CATCCCCTCC 
TATTTTATCG 
TTAGTTCATC 
CACAAACTTA 
AAAAAGTGGC 
CTTTAAGTAT 
GTTTTGAAAT 
TTCCATCTTC 
CACTACCATT 
TGTTAGCACG 
CATTGTAGCT 
CACCTGTACA 
CGTTTGTTGT 
: TTTCCACTTT , 
CTGCTTCACT 
GAATAATTTC 
ATCCTTCTTT 
ACATTGTATC 
TATGTTTTGT 
AATATACAAA 
CTTCTACAAT 
TTTTAACTTC 
TTGGAATACG 
TTTCTTTAAT 
TATTACGTTT 
CTGTTGCACT 



CTTTAGTCAG 
TACCTCCATA 
TATCTGATGA 
CCCTaCCCTA 
CTTCCTTTCC 
ATAATTATCC 
ATTTATTGTT 
GACAGTTCGT 
ACGTAGATAT 
TTGTGTTTTA 
ATTTTGGTAA 
TAATGTATGT 
ACGGGCTTGG 
TGGTAACCAA 
TAAAATAACA 
CATTTCTTCT 
ATCGAATTGA 
ACGGAAACAT 
ATTACGGTAG 
TTCTACTTTA 
TGCGTTCACA 
AATCATATAG 
ACGCGCACCT 
ATCCCAATGT 
AACGTTATCT 
ACAAAGGATA 
ATCGTCACCT 
TTTTAATGCG 
AATTAATTTA 



1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
234 0 
2400 
2460 
• 2520 
2580 
2640 
2700 
2760 
2820 
2880 
2940 
3000 
3060 
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TCAATTTTGC 


TCTTAACTGT 


GTCAGGCTCA 


TTTCTGAATA 


ATCTAATGTC 


TAACATTAAC 


3180 




CTTCATCCTT 


TCCCAAATAA 


TTATCATTTA 


TTATGGAATG 


ACGTACGTCT 


TTATTTTTTA 


3240 


5 


GAAAATAAAA 


AAAGACCACA 


TCCCTACAAG 


GGACGTGGTC 


TACGCGTTGC 


CACCCTATTT 


3300 




AACAATTTAA 


GTTATAAAGA TACACTAAAC CTAAATTGCA 


CTTCACTAAA 


ATAACXtGTTA 


3360 


10 


TCACCGATTG 


TTCTTTTAAA 


TTAAGTAGGT 


AGATTCATAT 


ATATGTTGAT 


TCTTGTTCAC 


3420 


ACTAACCACA 


AGCTCTCTGA 


TATCGAACAC 


TATATATTAC 


TTGTCCTACG 


AACAATGTCT 


3480 




TATTAAGTTA 


TTTTTAATAT 


AGCAAACTAT 


ATTTGCTTTT 


TCAAGTAACG 


ATTTCAAACA 


3540 


IS 


TCACTCATGT 


CGATTTAGTG 


ACATGCAGTC 


GTTTGATAAA 


TTGATTGCTT 


TAAATACTGT 


3600 




CAATATCTTT 


ATGAAATTGA 


CGATCATGTG 


TAATGGATGG 


CACGATACTT 


3660 






CATACTTGCG 


ACGTGTTTTT 


GGTGATAATC 


CTTCAACACC 


TTTTAACTCT 


3720 


20 




ATGCAATAAC 


ACATTCGATT 


GCCAGCACAC 


GTCTTGCATT 


TTCAATAATT 


3780 






GTCTAGCAGC 


TGTAGTTCCC 


ATAGATACGT 


GATCTTCXTG 


GTTCGCAGAT 


3840 




VjnnulUnlnU 


AATCAACACT 


CGCTGGATGC 


GCTAAAGTTT 


TATTTTCAGA 


AACGAGACTT 


3900 




r* & fin & fzr*ii.*T* 


ATTG CAT AAT 


CATCGCGCCA 


CTTTGCAATC 


CTGGCTCTGG 


ACTAAGAAAT 


3960 




Vak- luu Innnl 


CACCATTTAA 


TTGAGGATTT 


ACTAGTCGCT 


CTAGACGACG 


TTCCGATACG 


,4020 






CACTTACACC 


TAATTTAAGA 


TGATCTAATG 


CAAAAGCAAT 


AGGTTGTCCA 


4080 


30 




CACCTGAAAT 


AACAAACGTT 


TCATTTGCTT 


CCTCAAATAT 


AAGTGGATTA 


4140 




TraTTunrrc 

X l^nX X /WSvwVJ 


CATTCATTTC 


AAATTCTAAT 


TGCTGTTTAA 


CATAATTGAA 


TACTTGAAAA 


4200 






GGATTTGTGG 


TATACAACGC 


AACGTATATG 


CATCTTGTAC 


ACGTATTTCT 


4260 


35 


GATTGTCG CG 


TCGTTAATGT 


TGATC CTTCT 


AACCAATCAC 


GCATACGCGC 


TGCCACATTA 


4 320 




ATCTGTTCTT 


GAAAATTACG 


AACTGCGTGC 


ACATCATGTC 


GATATGCATC 


TATAATGCCA 


4380 


40 


TTAAGAGACT 


GATGCGTTAA 


TGCAGCAATC 


CATTCAGATT 


GGTAACCTAA 


ATCTTCTGCT 


4440 


TCTATATAAC 


TAATGACACC 


TTG AG CTGTC 


ATAGCTTGCG 


TACCATTAAT 


CAATGCTAAA 


4 500 




CCTTCTTTTAG 


CCTGAAGGTT 


CAAAGGTTGT 


CTATTTAATT 


CTCTT AATAC 


ATCGTCACTA 


4560 


45 


TCCTTTTCTT 


CCCCTCTGTA 


CAATACTTTC 


CCTTCACCAA 


TTAATGCTAA 








GATAATGGCG 


CTAAATCTCG 


TGATGCACCG 


AGAGAGCCTT 


GCTGTGGGAT 


TATCGGTATA 


4680 




ATACGTTCAT 


TTATAAAAAA 


TTGTAATTGT 


CTCACTAATT 


CTAAAGTGGC 


ACGTGAATGA 


4740 


SO 


CCTTTTAATA 


ATGTATTCAA 


TCGTAAAATC 


ATCATGACTA 


ATGCTACTTC 


TTTTGAAAAT 


4800 




GG CTCACCTA 


GTCCACAGGC 


ATGTGAGCGT 


ATCAGATTCA 


CTTGTAATTC 


ATTATATTGC 


4860 
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TCCTCATTTT 


CAATAATACG 


TTCAACTACC 


GCTCTACTTT 


TTTTGACACG 


TTCTAACGCA 


4980 


TCATCAATAA 


TTTCAATCTT 


TGATTGTTGT 


TGTAAAAATG 


ATTTAATATC 


CTCAATTGTT 


5040 


AGTGTTTCAC 


CATCTAAATA 


TAAAGTCATA 


TATGTTACCC 


CCTTGTTTAT 


ATTAAGTAAC 


5100 


CCATCCTTCT 


TGAAGTATAC 


GTTTTCATTT 


TTATTGAAAC 


AATGGTTTTA 


CGTACATTTA . 


5160 


TAACCTATTA 


TCAGAGCACT 


ATTGTAGTGC 


GTTAAAGGAT 


ATTAAGATTG 


TTGTAAG CAT 


5220 


ATTTAATAAT 


TTATCTATTG 


ACGAATTGCA 


TATACAGGTA 


TAGTATTTTC 


TATTGTATTT 


5280 


AACGACAAAT 


AATAATGAAT 


TCAGAAATTT 


ATAATACATT 


TTGTTAAAAG 


TTACTATATA 


5340 


TTTTTAAAAT 


TGAATAAATT 


CGGAAAAGGC 


TTTTACATGG 


GAGGTTATAT 


CACTATGGAA 


5400 


ACGTTAAATT 


CTATTAACAT 


TCCTAAGCGT 


AAAGAAGATT 


CACATAAAGG 


TGATTATGGC 


5460 


AAAATTTTAT 


TAATTGGTGG 


ATCTGCTAAC 


TTAGGTGGTG 


CCATTATGTT 


AGCGGCTCGT 


5520 


GCATGTGTAT 


TTAGCGGTAG 


TGGTTTAATC 


ACTGTAGCTA 


CACATCCAAC 


AAATCATTCA 


55B0 


GCATTACATT 


CTCGTTGCCC 


AGAAGCGATG 


GTTATTGATA 


TTAATGATAC 


GAAAATGTTG . 


5640 


ACGAAAATGA 


TTGAAATGAC 


TGACAGTATA 


CTAATTGGTC 


CAGGTCTTGG 


CGTTGATTTC 


5700 


AAAGGAAATA 


ATGCCATTAC 


ATTC CTACT A 


CAAAATATAC 


AACCGCATCA 


AAATTTAATC 


5760 


GTAGACGGCG 


ATGCGATTAC 


AATCTTTAGT 


AAACTGAAAC 


CGCAATTACC 


TACATGTCGT . 


5820 


GTGATCTTTA 


CACCACACCT 


CAAAGAATGG 


GAACGATTAA 


GTGGTATTCC 


TATTGAGGAA 


5880 


CAGACATATG. 


AG CGTAATCG 


TGAAGCAGTX 


GATCGTTTAG , 


GTGCAACTGT 


TGTACTTAAA 


5940 


AAACATGGTA 


CTGAAATTTT 


CTTTAAAGAT 


GAAGACTTTA 


AATTGACAAT 


CGGTAGCCCA 


6000 


GCAATGGCGA 


CTGGTGGTAT 


GGGCGATACA 


CTTGCTGGTA 


TGATTACAAG 


CTTTGTCGGT 


6060 


CAATTTGATA 


ACTTAAAAGA 


AG CGGTTATG 


AGTGCCACAT 


ATACACATAG 


TTTTATTGGC 


.6120 


GAAA&CCTTG 


CAAAAGATAT 


GTATGTGGTG 


CCACCATCAA 


GACTTATCAA 


TGAAATACCT 


6180 


TACGCAATGA 


AACAATTAGA 


AAGTTAGTCA 


TTACTAATCA 


TTGAATATAG 


TAAAGCATTA 


. 6240 


CTTTCTAGCA 


TAAAAATAAG 


ACTGCCCTAC 


ATATAGGGAA 


GTCTTATTTT 


TT ATT ATT C T 


6300 


TCATCTGATG 


ATTGTTGTAT 


AT CTTCTTCA 


ACACGATCCA 


TGAAATCTTG 


TCTTACTTCA 


6360. 


ATACGTCCAT 


CTTCATCATT 


TTCTTCTGAA 


■ TCAATCACTT 


CAGTATGAAT 


TGCATTTCCT 


6420 


GGTGTTTCAT 


CATTTaCAAC 


CGCTTCACGT 


TGTTGTTCAG 


TACCATCTTC 


AGATACAGTT 


6480 


GAAGTAGATT 


GCTCATCTTC 


ATTCGTTTCA 


TCTTCTGCAT 


CTTCTTTTAC 


TTTAGCAACC 


6540 


GTTGAAACAA 


ATTGATCATC 


ACCTAAGCGA 


ATTAAGCGAA 


CACCTTGTGC 


TGCACGACCA 


6600 


TTTTGAGAAA 


TATCTGCAAC 


ATCTAGTCGA 


ATAATGACAC 


CTGCATTAGT 


AACAATCATT . 


6660 
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' t ^ TV TV » I » TV /""^ ^T^PT 1 


A^WiCCACQA 


, TTTGATAAGC 


GATAGTCATT 


AACTGGCGTA 


6780 




PfiTTTA fV'Il'P 

V_VJ i X 1AVW\1 


HHWUil X X It- 


' ROT* A TV / »«f»Tv OHT 

J\\y X AACTACT 


AATACTTCAT 


CAACACTGTT 


TGCATGAGCT 


6840 


5 


ACATCAAGCC 


X rtrV V* XXL. 


vj X LACL X 1 v_A 


f**C* TV TV ✓*» rppfii ■» fk 

CGAAGTGTAA 


TACCTTTCAC 


ACC CGTTGCT 


6900 




GTACGGCCTA 


A Aft/; 7A fVT'TV. ft 


TGTTGATTCA 


GGGAATCGAA 


TTAATGATG C 


ATGTGATGTA 


6960 


10 




* j ■ ft ■ 1 L ^"^T^T^j^^T^T^^^ 


ACCACTTGTT 


AAGCGAACTG 


CAATTAACTC 


ATCATCTTCT 


7020 




TC*fZr* ft IS TV^'fP 
X LvjLAAIV. I I 


ACCATTTCTA 


TTTATTCTTG 


AGAAGTTACT 


TAATGCTGAA 


7080 




CGTTTAACGA 


CACCACGilT 


AGTTGGAAAC 


ACTAAGAAGT 


TGTCTTCACT 


TTCAAGGTCT 


7140 


15 


1 iAALAuLAA 


TCATTGTACT 


AATGACTTCA 


TCATTTTCAA 


GTTCAATAGC 


ATTCACTACA 


7200 




GGAATACCTT 


TAGACTGT CT 


TGATAACTCA 


GGCACTTCGT 


AACCTTTAAG 


TTTGTATACA 


7260 




CGACCTTTGT 


TAGTAAAGAA 


CAATACATGG 


TCATGTGTAC 


TTAAAGTTAC 


CAATTGACTG 


7320 


20 


ACAAAATCTT 


CTTCCAATGT 


ATTCATACCT 


TGAACACCAC 


GACCACCACG 


GTTTTGAGCA 


7380 




CGATATGTAG 


ATACCGGCAA 


ACGTTTAATG 


TAGTTATTAT 


GGCTTAGTGT 


AATTACTATT 


7440 




TGTTCTTCTG 


GAATTAAGTC 


TTCGTCCTCT 


AAGTCTTCAA 


ATCCACCTAA 


TTGAATTTCT 


7500 


25 


GTACGACGAT 


CATCACOGAA 


ACGATCTCTA 


ATTTCAGTCA 


ATTCATCTCT 


AACTAACTGT 


7560 




T* ft iv /Mk /"inn 1 1 

AATAACACTT 


CTTCATCAGC 


TAAGATTGCT 


TCTAATTCAC 


TAATATAATT 


TAATAACTCA 


7620 




TTATATTCAG 


CTTCAATTTT 


GTCTCTCTCT 


AAACCTGTTA 


GACGTCTTAA 


ACG CATGTCT 


7680 


30 


x tv iv t* mn/'iVtnvn 

AAAATAGCTT 


GAGCTTGTTT 


TTCAGAAAGT 


TTGAAGCGTT 


GTTGCAAGCT 


TTCCATTGCA 


7740 




ACTTTATCTG 


TATCTGACTC 


ACGAATCGTT 


GAAATAATTT 


CATCGATATG 


GTCAAGTGCG 


7800 




aXaUj 1 nA 1 v_ 


CTTCTAAAAT 


GTGGG CACGA TCTTTAGCTT TACGTAAgTT GTATTGCGTA 


7860 


35 


CGTCTTCTAA 


CAACTGTCTT 


TTGATGCTCT 


AAATAATGTA 


CCAACGCTTC 


TTTTAAATTA 


7920 






GTCTACCATT 


TAGAAGTGCA 


ATCATATTCA 


CACCAAATGA 


TGTTTGAAGA 


7980 


40 


VTSjX\J 1 1 1 VT 1 1 


TGTATAAGTT 


ATTTAAAATG 


ACACTAGCAT 


TTGCATCCTT 


ACGCACATCA 


8040 


iti &r , a r* 


rrspR /i /-i j\ /~»«-r» 
Vj UALIAL vJAO X 


ACGTAAACTT 


GTTTCA^TCAC GTAAATCAGT GATACCGTCA 


8100 




•rii 1 X J.i-1 XW X 




CTCTG CAATT 


TTTTCAATCA 


TACGAGCCTT 


ATTCACTTGG 


8160 


45 


AAAGGAATTT 


CAGTGACAAC 


AATACGTTGA 


CGTCCGCCTC 


CACGTTCTTC 


AATAACTGCA 


8220 


CGAGAACGCA 


TTTGAATTGA 


ACCACGACCT 


GTTTCATATG 


CACGTCTAAT 


ACCACTCTTA 


8280 




CCTAAAATAA 


GTCCAGCAGT 


TGGGAAATCA 


GGACCTT CAA 


TATCCTCCAT 


TAACTCAGCA 


8340 


50 


ATTGAAATAT 


CAGGGTTCTT 


ACTTAAG CTA 


AGTACACCAT 


TGATTAATTC 


TGTTAAGTTA 


8400 




TGTGGTGGAA 


TATTCGTTG C 


CATACCTACC 


GCGATACCTG 


ATGCACCATT 


GGCTAATAAG 


8460 
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AAATCTATTG 
GCTTCAGTAT 
CCATCAACAA 
ATAGATGAGT 
TTTTTAT ATG 
TGTACTGGTT 
GCATAATCTA 
TGAGGTAATT 
TCTAAGTTTG 
CCCATTAACA 
AGAGCGCGGT 
AGACCTTTGT 
TCAAGTTCCC 
GGTGGCTGTG 
AATGTTAATA 
ATTTTGTGAT 
GTG AT CATTT 
TTTAATATCT 
GTAGACCCCC 
CTAGAGCAAT 
GTTACTTCAC 
ACCACTGTAC 
AATTTATCTA 
AATTGAGGAT 
CCAGAAAGTC 
. ACACGCGTTA 
TTATTTGCGT 
ACTTCAATAT 
TTTTCGTTCA 



TATCTTTATT 
AACGCATTGC 
GCGGATAACG 
CACCATGAGG 
ATTTATCCGG 
TTAAACCGTC 
AAAATGATTC 
CAGCCATCAA 
CATAAACTGC 
TTTCAAATGT 
GCTCAGGGTT 
ATCGTGCAAT 
TATCATTGTA 
CAATATACAC 
ACAATGTTCT 
ATCTTG CTTT 
GACGAATTTC 
TACCTCGTAA 
CGGCAGAGTC 
CGGCTAATTT 
GCGCTTTTTT 
GTGCGACTTG 
CAACTTGACG 
CACCATGTTT 
TATCTTTTTC 
ATGCACGTTT 
AAGTTAAAAG 
CATCTTTAGA 
ATAACTCAAC 



AATATCACGT 
TGCTGCGCCA 
ATAACTGAAA 
GTGATATTTA 
TGTCATACCT 
ACGAACATCT 
ACGCATTTCA 
GAGTTCCTCC 
ATTATCTTCT 
TTGGTCCGCT 
CATTGTTGTT 
AGACCATTTT 
TACATAATAC 
ATAGCCTGCT 
AATATGCGCT 
CGCTAGATCA 
ATTGTTATTC 
TGGTAAAATC 
CCCTTCGACT 
ACCTGGAAGG 
CGCAGCAACA 
TGGATTTTCA 
CACTTCAGAA 
GATAGATATA 
TT CTTT CAT A 
GAATCCGTCT 
ATTTGTGGCA 
TTGATGAATA 
GTACGATTTA 



AACAGTTCAA 
TCTCCATCCA 
TCTTGAGCCA 
CCCATTACGT 
TGTTCATTTA 
GGCAATGCAC 
CTGGTAATAT 
TTCAAAAGTT 
ATAAATTGTC 
TCAATCG CAT 
TCCCAtAATT 
GGTGTTGGAT 
TTTTGTTTAC 
TCAATTAACG 
CCATCCACAT 
AAGTCGCCAC 
AAAATTCTAT 
GCCTGCGTTC 
AAGAAAATCT 
CTTGCTACAT 
CGTGCACGTG 
TATAAAAATC 
TT AC CTAATT 
ATTGCTGTCA 
ATCTTGCTAC 
TCATGCGTAC 
TATCCTGAGT 
TAAATTGGCT 
ATACCGCCCT 



GTGTGATTTT 
TTGAACCAAA 
TACGTACCAT 
CACCAACGAT 
ATCCATATAG 
GAGCAACGAT 
TTCGTTCATT 
CAGTTCACAG 
TACGGTTTTC 
CTTCAAGTTT 
GATCTGCATT 
TCAATTCAGA 
CTTGTGTCAG 
GTCTCATAAA 
CGGCATCAGT 
CGATTCCTGT 
CTAATCGTGC 
TAGAGTCACG 
CACATTCTTC 
CTAACGCTGA 
CCGCCATAAT 
GTTCAAAGTG 
TTGTCTTCGT 
TACCTTCACG 
TTAAACCATA 
CACCTTCATA 
TATATTGAAT 
CATCATGAAT 
CATAGTGATA 



AGTCATACGC 
GTTACCTTGG 
TGCTTCATAA 
ACGTGCTGAT 
TATACGACGA 
AACACTCATC 
TATTCTTGAT 
CGCTTAGAAG 
TACAACGTCA 
TACTTGTAAA 
CATTTCTCCA 
TTTAAGTTTA 
TTTATACAAC 
TCGATAGAAG 
CATAATGAOG 
ACCAAATGCT 
TTTTTCAACA 
ACCAGATTTT 
AGGACTTTTA . 
TTTACGACGT 
ACCTTTTTCA 
- CTCTGAGAAT 
TTGACCTTCG 
TGTATCTTCA 
ACTATTTAAG 
CGTATGAATG 
CGCAATTTCT 
AGGTTCTTTA 
GGAGTCTTCT 



8580 
8640 ^ 
8700 
8760 
8820 
88B0 
B940 
9000 
9060 
9120 
9180 
9240. 
9300 
9360 
9420 
9480 
9540 
9600 
9660 
9720 
9780 
9840 
9900 
9960 
10020 
10080 
10140 
10200 
10260 
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GCAAGCTCTC TAATACGCTG CTGTAATGTT TCATAGTTGT ATACAGTTGT CTCTGTGAAQ 10380 

ATTTCTCCAT CTGCTTTAAA ACGAAtGaCA GTACCTGTCT TAtCAGTnGT GCCAACTTCT 10440 

TTTAAGTCAA ATTGAGGTAC ACCTTTTTTA TATGCTTGAT GATATATAGT CTCATTTCTG 10 500 

TGTACATATA CTTCTAAGTC TTGTGACAAT GCGTTTACAA CTGATGAACC AAGACCATGT 10560 

AAACCACCAG ATACTTTGTA TCCGCCACCG CCAAATTTAC CACCAGCATG TAAAACAGTT 10620 

AAAATAACTT CGACAGCTGG ACGTCCCATT TTTTCTTGAA TATCAACTGG GATACCACGT 10680 

CCGTTATCCG TTACTTTAAT CCAGTTATCT TTTTCAATAA CAACTTCAAT TTGATTTGCA .10740 

TAACCaGCTA ATGCTTCATC GATACTATTA TCGACAATTT CCCACACTAA ATGGTGCAAA 10800 

CCTCTCTCTG AAGTCGATCC TATATACATA CCTGGTCTTT TACGTACTGC TTCTAAACCT 10860 

TCTAATACTT GTATTTGCCC AGCACCATAA TTATCCGTGT TGTTTACATC TGACAATGCA 10920 

GTCACCATCG CTTTCTGTTA CTTTATAATT TCACCTTGAT TAATACGATA CAATTTAGCG 10980 

TTATTCATGA TTTCATGATC AATAC CATCT ACAGATGTCG TAGTGACAAA TGTTTGTACT 11040 

TTATGCTGAA TCGTACTTAA TAAATGCGTT TGACGCGAAT CATCTAATTC ACTGAGTACA 11100 

TCGTCTAATA ATAAGATGGG ATATTCCCCA ACTTCGATAT TCATTAACTC AATTTCAGCT 11160 

AATTTAATGG ACAAAG CCGT TGTACGTTGC TGTCCTTGAG AAC CATATGT TTGAGCATCC 11220 

ATG CCATTCA CATCAAAACT TAT AT CATCT CGATGTGGTC CGAATAAGCT AATGC CTCGT 11280 

TCTTTTTCTC TTTG CATATT ATCG CTAAGA ATAGACATAA TTTCTTCAAG TCGTGCCGCT 1134 0 

TCATTTTGAG CATAATCAAA TTTAAGACTA GGTAAATAAT TCAGCGACAA CGCTTCTTTA 11400 

TCATTTGTGA TACCAG CATG AATCGGTTTA GCTAACGACT CTAGCTCTTG AATAAAATGT 11460 

GCACGTTTAT CAGTTACTTT CATTGCATAT TCAGCAAACT GCTGATTTAA TACTTCCAAC 11520 

ATTGTTAAGT CCTTTTTTTG GCCTAATTGT AACTGCTTTA AGTAATTATT CT TTTGOTTT 11580 

AAAATACGTT GGTATTGAGC TAAATCATTT AAGTAAACAG CAGAAATTTG GCCCAACTCC 11640 

ATATCTATAA AGCGTCGTCT TATTtGrGGr GAGCCTTTTA CAATATTCAA ATCTTCTGGC 11700 

GCAAATAGAA CCACATTGAG GTGTCCAATA TATTGAGTTA GACGACTTTG CTCTAAGTGn 1176 0 

ATTCACTTTG GACTTGTTTA CCTTTnTTAG TTATAAACAT TGTTAATGGG CATCGTGCCG 11820 

TGT 11823 
<2) INFORMATION FOR SEQ ID NO: 137: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 692 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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180 

240 

300 

360 

420 

480 

540 

600 

660 

692 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 137: 
ATAATTATTA ACATGGTGTG TTTAGAAGTT ATCCACGGCT GTTATTTTTG TGTATAACTT 60 
AAAAATTTAA GAAAGATGGA GTAAATTTAT GTCGGAAAAA GAAATTTGGG AAAAAGTGCT 
TGAAATTCCT CAAGAAAAAT TATCAGCTGT AAGTTACTCA ACTTTCCTAA AAGATACTGA 
GCTTTACACG ATTAAAGATG GTGAAGCTAT CGTATTATCG AGTATTCCTT TTAATGCAAA 
TTGGTTAAAT CAACAATATG CTGAAATTAT CCAAGCAATC TTATTTGATG TTGTAGGCTA 
TGAAGTTAAA CCTCACTTTA TTACTACTGA AGAATTAGCA AATTATAGTA ATAATGAAAC 
TGCTACTCCA AAAGAAACAA CAAAACCTTC TACTGAAACA ACTGAGG AT A ATCATGTGCT 
TCGTAGAGAG CAATTCAATG CCCATAACAC ATTTGACACT TTTGTAATCG GACCCGGTAA 
CCGCTTTCCA CATGCAGCGA GTTTAGCTGT GGCCGAAGCA CCAGCCAAAG CGTACAATCC 
mTTATTTATC TATGGAGGTG TTGGtTTAGG aAAAACCCAT TTAATGCATG CCATTGGTCA 
TCATGTTTTA GATAATAATC CAGATGCCAA AGTG ATTT AC ACATCAAGTG AAAAATTCAC 
AAATGAATTT ATTAAATCAA TTCGTGATAA nA 
2S (2) INFORMATION FOR SEQ ID NO: 138: 

(i) SEQUENCE CHARACTERISTICS: . 

(A) LENGTH: 7900 base pairs 

(B) TYPE: nucleic acid. 

(C) STRANDEDNESS: double 
30 (D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO : 138: 
35 ATACTGTAGC GCAAATTTCA CAATGGCATG TT ATAGAAG A TTTAGTTACG AATGAATTAG 60 

GTATTAGTAT TTTACCAACA TCAATTTCAG AgCAACTAAA TGGAGATGTG AAGCTGtACG 
CATTGAAGAT GCTCATGTAC ATTGGGAATT ;AGGTGTTGTT TGGAAGAAGG ATAAACAATT 
AAGTCATGCC ACAACGAAAT GGATAGAATT TTTGAAAGAC CGTTT AGGCT AACATATTAA 
TAAAGCACTC ATTATTTAAG GCGCATCATT ACGTGGGTCA TTGAAATAAT GAGTGTTTTT 
TTGTGAAAAT GAAGTGAAAT TTAGAGAGCG TTTCCATAGA AAATAGTAAT ACAAACTATA 
AAAAAAGAGT ATTTTTAT AT TGTGTACGCC ATCTTTATAA TAGTTATTGT AACAATTTAG 
ACATATTTAG AAAGGGATGG CGCCATGCAC AAAGTCCAAT TAATAATCAA ACTACTACTA 
CAACTAGGAA TCATCATTGT GATTACTTAT ATTGGCACAG AAATTCAAAA GATTTTTCAT 
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180 
240 
300 
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420 
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ATTGTACCGC TAACTTGGGT AGAAGACGGT GCAAACTTTT TATTAAAGAC GATGGTCTTT 660 

TTCTTCATAC CGTCAGTTGT AGGtATTATG GaTGtgCTTC CGAAATTACG CTAAATTATA 720 

TACTCTTTTT CGCAGTCATT ATCATAGGAA CATGTATCGT TGCATTATCT TCAGGTTATA 780 

TTGCTGAAAA AATGTCyGtT AAACwTAAAC ATCGTAAAGG TGTAGACGCt TATGAATGAT 840 

TACGTGCAAG CCTTATTAAT GATTTTGTTG ACTGTCGTTT TATATTATTT CGCTAAAAGG 900 

TTACAACAAA AATATCCGAA CCCATTTTTG AATCCAGCAT TAATTGCATC TTTAGGAATT 96 0 

ATTTTTGTCT TACTTAT CTT TGGAATTAGT TATAACGGGT ATATGAAAGG TGGCAGTTGG 1020 

ATCAACCATA TTTTAAACGC AACGGTCGTA TGTTTAGCGT ACCCACTTTA TAAAAATAGA 1080 

GAGAAAATTA AAGACAATGT CTCTATCATT TTTGCAAGTG TATTAAcTGG CGTCATGCTG 114 0 

AATTTCATGT TAGTGTTCTT AACACTTAAA GCATTTGGCT ATTCTAAAGA CGTCATTGTA 1200 

ACGTTATTGC CCCGATCTAT AACAGCCGCA GTAGGTATCG AAGTGTCACA TGAACTAGGT 1260 

GGTACAGATA CGATGACCGT ACTTTTTATT ATCACAACGG GTTTAATCGG TAGTATTTTA 1320 

GGTTCGATGT TATTAAGATT TGGAAGATTT GAATCTTCTA TCGCCAAAGG ATTAACGTAT 1380 

GGGAATGCGT CACATGCATT TGGCACAGCT AAAGCACTAG AAATGGATAT TGAATCCGGT 144 0 

GCATTTAGTT CAATTGGGAT GATTTTAACT GCAGTTATTA GTTCAGTGTT AATACCTGTT 1500 

CTAATTTTAT TATTCTATTA ATTTAGATAT TTAAAATGAT AGACAGAAAG GGAGGCTATT 156 0 

AGTAATAATG GCAAAAATAA AAGCAAATGA AGCATTAGTT AAAGCATTAC AAGCaTGGGA 1620 

TATAGATCAC TTGTATGGTA TTCCAGGAGA CTCAATCGAC GCATAGTCGA TAgTTTACGT 1680 

ACAGTGAGAG ATCAATTTAA ATTTT AT CAT GTACGTCATG AAGAAGTAGC AAGCTTAGCG 1740 

GCTGCTGGTT ACACAAAATT AACTGG T AAA ATCGGTGTGG CATTAAGTAT CGGTGGCCCT 1800 

GG TTTAATTC ATTTATTAAA TGGTATGTAT GATGCCAAAA TGGATAATGT ACCGCAATTA 1860 

ATATTATCTG GACAAACGAA TAGTACAGCA CTTGGAACGA AAGCATTCCA AGAAACAAAT 1920 

TTACAAAAAT TATGTGAAGA TGTAGCCGTT TATAATCACC AAATTGAAAA AGGTGACAAT 1980 

GTGTTTGAAA TCGTTAACGA AG CAATTCGT ACGGCATATG AACAAAAAGG TGTAGCTGTT 2040 

GTTATTTGTC CTAACGACTT ATTAACTGAA AAAATTAAAG ATAGAACGAA TAAACCAGTA 2100 

GATACATCAA GACCAACAGT AGTATCACCA AAATATAAAG ACATCAAAAA AGCGGTTAAA 2160 

CTAATTAATA AAAGTAAAAA GCCTGTCATG TTAATTGGTG TAGGTGCGAA ACATGCGAAA 2220 

GATGAGCTAC GTGAATTTAT TGAAATGGCT AAAATTCCTG TCATTCATTC ATT AC CAG CT 2280 

AAAACAATCT TGCCGGATGA TCATCCATAT AGTATCGGtA ACTTAGGTAA AATCGGTACC 2340 
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CCATATGTGG 


ATTACTTACC . 


TAAfSA AAAAT 


ATTAAAGCCA 


TTCAAATTGA 


CACAAATCCT 


2460 




AAAAATATCG 


GACATCGTTT 


CAATATTAAT , 


GTAGGAATTG 


TTGGAGATAG 


TAAAATTGCG 


2520 


5 


TTGCATCAGT 


TAACTGAAAA 


TATTAAACAT 


GTTGCTGAAA 


GACCATTCTT 


AAACAAAACG . 


25B0 




TTAGAACGTA AAGCGGTTTG 


GGATAAATGG 


ATGGAACAAG 


ATAAAAATAA 


TAATAGTAAA 


2640 




CCATTACGTC 


CAGAACGATT 


AATGGCATCA 


ATCAATAAAT 


TTATTAAAGA 


TGATGCAGTG 


2700 


10 


ATTTCAGCAG ATGTAGGTAC AGCAACAGTT 


TGGTCAACTC 


GATACTTAAA 


CCTTGGTGTA 


2760 




AATAACAAGT 


TCATCATTTC 


AAGTTGGTTA GGTACAATGG 


GTTGGGGTCT 


TCCAGGTGCA 


2B20 




ATTGCATCAA AAATTGCATA 


TCCAAATAGA 


CAAGCCATCG 


CAATTGCTGG 


TGACGGTGCA 


2880 


15 


TTCCAAATGG 


TAATGCAAGA 


CTTCGCTACA 


GCAGTACAAT 


ATGATTTACC 


TTTAACTGTA 


2940 




TTTGTACTTA ATAACAAACA 


GTTAG CATTT 


ATTAAATATG 


AACAACAAGC 


AGCTGGTGAA 


3000 




TTAGAATATG 


CAGTTGATTT 


TTCTGATATG 


GATCATGCAA 




GGCAGCAGGT 


3060 


20 


GGTAAAGGTT 


ATACAATTAA 


GAGTGCTAGC 


GAAGTAGATG 


(""TATAfiTPfiA 


AGAGG CATT A 


3120 




GCACAAGATG 


TACCAACGAT 


TGTAGATGTA 


TATGTTGATC 


PT A ATYlPTfSP 




3180 


25 


GGTAAAATTG 


TAAATGAAGA 


AGCGCTTGGT 


TATGGTAAGT 




ATPA ATT ACT 


3240 


GAAGATAAAC 


ATTTAGATTT 


AGATCAAATT 


CCACCAATTT 


CAGTGGCAGC 


AAAACGTTTC 


3300 




TTATAACTGA 


TTTAAAGGTT, ATCACAATTG 


AATTGAACTA 


TAAAAACGGT 


AATTT CT ATT 


3360 


30 


TCAACAAAAT 


GGGAATTGCC 


GTTTTGTTTA 


TTTATCACAA 


ATGATCGTAC 


TGAATTGATG 


3420 


ATAAAATTGT 


GAAAAAGTTG 


TTGAAAACGC 


TTTTACAAAT 


ATGTATAATA 


GCTATGAATT 


3480 




AGATATCACT 


TGCGTGTTAC 


TGGTAATGCA GGCATGAGCA AACAACCGCA „ CTATGAGAAT . 


.3540 


35 


_ AGTCTTGTTT 


GTTCATGCCT 




TACATGGAAG 


CGGAAATTGA 


GATAGGGGAT 


3600, 


GTTT5TATGT TTAAGAAATT 


GTTTGGACAA 


TTGCAACGTA 


. TCGGTAAAGC 


ATTAATGTTA 


3660 




CCTGTTGCGA 


TTTTACCAGC 


AGCTGGTATT. 


TTATTAG CGT 


TTGGTAACGC 


AATGCACAAC 


3720 


40 


GAACAATTAG 


TAGAAATTGC 


ACCATGGTTA 


AAAAACGATA 


. TCATTGTAAT 


GATTTCGTCG 


3780 




GTCATGGAAG 


CAGCAGGACA AGTTGTATTT 


GAT AACTTG C 


CATTATTATT 


TGCAGTTGGT ■ 


3840 




ACAGCACTTG 


GATTAGCAGG 


AGGAGACGGT 


GTTGCAGCAT 


TAGCAGCGCT 


AGTAGGTTAC 


3 900 


45 


TTAATTATGA 


ATGCAACAAT 


GGGGAAAGTG 


TTG CACATT A 


CAATTGATGA 


CATTTTCTCA 


3960 




TATGCCAAAG 


GGGCAAAAGA 


ATTAAGTCAA 


GCAGCGAAAG 


AACCAGCACA 


TGCTTTAGTA 


4020 




TTAGGTATTC 


CAACGTTACA 


AACGGGTGTG 


TTTGGTGGTA 


TTATCATGGG 


TGCTTTAGCC 


4080 


SO 


GCATGGTGTT 


ACAACAAATT 


TTATAATATT 


ACACTACCAC 


CATTTTTAGG 


ATTCTTTGCA 


414 0 
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AGCTTTGCGT 


GGCCACCAAT 


TCAAGATGGA 


TTAAATAGTT 


TATCGAATTT 


CTTATTAAAT 


4260 




AAAAATTTAA 


CATTAACAAC 


GTTTATATTC 


GGTATTATTG 


AACGCTCATT 


AATTCCATTT 


4320 


5 


GGTTTACATC 


ATATTTTCTA 


TTCACCGTTC 


TGGTTTGAAT 


TCGGAAGTTA 


TACAAATCAC 


4380 




GCAGGTGAAT 


TGGTTCGTGG 


TGACCAACGT 


ATTTGGATGG 


CACAATTGAA AGATGGCGTA 


4440 




CCATTTACTG 


CTGGTGCATT 


TACTACTGGT 


AAATATCCAT 


TTATGATGTT 


TGGTTTACCA 


4500 


10 


GCGGCGGCAT 


TTGCTATTTA 


TAAAAATGCA 


CGACCAGAAC 


GTAAAAAAGT 


CGTGGGTGGT 


4560 




TTAATGTTAT 


CAGCAGGATT 


AACTGCATTT 


TTAACTGGTA 


TCACTGAGCC 


ATTAGAATTT 


4620 




TCATTCTTAT 


TTGTAGCACC 


AGTACTTTAT 


GGAATTCACG 


TATTATTAGC 


TGGTACATCA 


4680 


15 


TTCTTAGTAA 


TGCATTTATT 


AGGCGTTAAA 


ATTGGTATGA 


CATTCTCAGG 


TGGTTTCATA 


4740 




GATTATATTT 


TATATGGTTT 


ATTAAACTGG 


GATCGTTCAC 


ACGCATTATT 


AGTTATTCCA 


4800 


20 


GTCGGTATTG 


TATATGCTAT 


CGTGTATTAC 


TTCTTATTCG 


ACTTTGCAAT 


TCGTAAGTTT 


4860 


AAATTGAAAA 


CACCAGGTCG 


TGAAGATGAA 


GAAACTGAAA 


TTCGTAACTC 


TAGTGTCGCA 


4920 




AAATTACCAT 


TTGATGTCTT 


AGATGCAATG 


GGTGGAAAAG 


AAAACATTAA 


ACATTTAGAT 


4980 


25 


GCATGTATTA 


CACGTCTACG 


CGTAGAAGTG 


GTTGATAAAT 


CAAAAGTAGA 


TGTAGCAGGT 


5040 


ATTAAAGCTT 


TAGGCGCATC 


AGGTGTATTA 


GAAGTTGGAA 


ACAATATGCA 


AGCTATCTTT 


5100 




GGTCGAAAAT 


CAGATCAAAT 


TAAACATGAT 


ATGGCCAAGA 


TTATGAGTGG 


TGAAATTACG 


5160 


30 


AAACCAAGTG 


AAACGACAGT 


GACTGAAGAA 


ATGTCAGATG 


AACCAGTTCA 


CGTAGAAGCA 


5220 




CTTGGAACAA 


CAGACATCTA 


TGCACCAGGT 


AT CGGTCAAA 


TCATTCCATT 


ATCAGAAGTA 


5280 




CCTGATGAAG 


TATTCGCTGG 


TAAAATGATG 


GGTGATGGTG 


TTGGCTTTAT 


CCCTGAAAAA 


5340" 


35 


GGTGAAATTG 


TAGCACCGTT 


TGATGGTACA 


GTGAAAACAA 


TCTTCCCTAC 


GAAACATGCG 


5400 




ATAdGATTAG 


AATCTGAAAG 


TGG CGTCGAA 


GTACTTATTC 


ATATTGGTAT 


CGATACAGTG 


5460 




AAACTGAATG 


GTGAAGGATT 


CGAAAGTCTG 


ATTAACGTTG 


ATGAAAAAGT 


AACACAAGGT 


5520 


40 


CAACCATTAA 


TGAAAGTGAA 


TTTAGCATAC 


TTGAAAGCAC 


ACGCACCAAG 


CATCGTTACA 


5580 




CCAATGATTA 


TTACAAATCT 


TGAAAATAAA 


GAACTTGTCA 


TTGAAGATGT 


ACAAGATGCT 


5640 






/T.vjv_ i. ftn x X n 1 




innivjnl 1/iA 


AAATGAAACA 


GCATATCAAA 


5700 


45 


TGAATGAACT 


TTTAGTCATT 


CGTAGTGCGT 


ATGCGAAGTA 


GCGAGTTGAA AGAGAATACG 


5760 




TTACAAAAGG 


CAGTAGCTTA 


AAATGAAGCT 


ACTGCcrrrr 


TAGTGCGCAA 


TGATGTATAG 


5820 




CAGGTGTGTT 


GATGrTAATA 


AGTTAAATAT 


TAGTGTTAGA 


TATAGAAAAC 


ATTGCTTATG 


5880 


50 


TTTTTGTCAC 


ATTTTAGAAA 


AATGCATCTT 


CGCGACTAGC 


CAAATTAATA 


GTCTCATTGA 


5940- 
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50 



AATAAATTAA 
AGAAGGTCTA 
GGGTGTCGTT 
TAATCAGCAC 
AACGGAAGCA 
CTTAGTTAAA 
CGTGCATTGT 
CTCTGTGCCA 
ATAAAAAGTA 
GAATTTATTC 
TGTCATGCCG 
GCTGTGATTA 
CCTGTGGATT 
ATGCAACGTT 
GAGCATTAAT 
CCCAGTAAAT 
ATCAAAGAGG 
GTTGCAG CAT 
GAACAAGGTA 
AAAGCATTAG 
TTTAAGATGC 
AAACAAGATA 
CCACTCAAAA 
ATCATGCCAG 
GAAAAGTTGT 
GGTGACTCTG 
ATTGTGCAAC 
CCTGAAATTC 
TTAGCTGAAC 



CATGATTTTA 
TTAGTTGCAG 
AGTAATATCG 
ATGAATTACT 
GAGTATAAAG 
GCAAGCAAGA 
ATTGGTACAC 
CAAGTGTTTC 
AGAAGGTGTT 
ATCAATATCC 
TTTTACCACA 
ATCAAAGTCA 
TAATTTTTAT 
TTGAACATCA 
ATCGCAAATG 
ATTGGTAGTA 
AGTGACGACA 
ACGCACATAT 
TACGATTATC 
AAAAAATGGC 
CAGTAAAAGT 
AGCATCAACG 
TTCATTTCGA 
TATATCCGAA 
ACCATGATTT 
CGGGCGGTCA 
CAGGACATAT 
CTGACTACTT 
AATGGGCAGG 



AATCTATTTG 
AGAAAGAAAT 
TTTATATTAG 
CAACAATGAT 
TACCTGTCAC 
TGAAATGGGT 
AGACAGGCGG 
AAGACATTTT 
CGAAATGGTT 
GTTAGCAGTT 
AATTGAAGAC 
GGTGGAAGCT 
GAATGGAAAA 
TCTTAAGCAA 
ATTAGCATTG 
ATTAGAATCA 
AATGCGTAAA 
TAG AATTAAA 
TAGAGCTAAG 
GCCACAGACA 
GGATAAGCAC 
CGTTGTATTA 
ATTTATTGAT 
GATTCOGCAT 
ATTGAATCAA 
AATTGCTTTA 
TGTATTAATT 
AAAGAAAGAC 
GGACACACCT 



TAAGATAAGG 
CGAAGTGAAT 
ATGGTTCGAA 
CAATCAAGGC 
AATACATGAC 
GTTTCAGTTT 
TTTTTACAGA 
AGOVACAAAA 
AAGCAATTAA 
GTACATGTCA 
TTGATGCAAT 
ATTGCTGGAG 
GAAATGCATC 
ATGAATGATA 
CTAAGATTAT 
GCATGGTACA 
AAATGGTCTA. 
GAAAAACGCA 
CGTCGTTTTA 
GCAGGCGAAT 
TTCGGTTCAA 
TATG CACATG 
GAACTTGCAG 
CAAGATTATC 
GTAGCAGATT 
TCATTTGCTC 
TCACCAGTTT 
CCAATGGTAG 
TTAGATAACT 



AGATTTGTCA 
GGTTACGACA 
GATTTGAGAA 
ATTTCACCTA 
AAACCAGTAG 
GAAATTGTGT 
TTGAGTGATA 
TAATGACTTC 
ATAGTGTCGA 
TGCGCGATCA 
CATATCCCAA 
AATTAAATAT 
GTCAAGGGCG 
GTGTAAATAA 
GTAGACATCA 
GTAGAACTAT 
, CACTTGCGTT 
GTGTGAAAAG 
- TGTATAAAGA 
ATGAGGGAAC 
CCGTTTATAC 
GAGGCGCATG 
AAACACTCAA 
AAGCGACGTA 
CTAAACAAAT 
AATTGTTAAA 
TAGATGCAAC 
GTGTGGATGG 
ACAAAGTATC 



TTATGACAAC 

TTGATGCGAT 

CAGCGTTTAT 

TACTTATGAA 

GTCGTATTTA 

CCGCACATGG . 

AGAAGATAAC 

ATTTTAAAAT 

AGCATTCCGT 

GTGTAGCGTG 

TGTGCCATTA 

TTT CaCTGT A 

TTTTATCGAT 

CGATGTCGAT 

TAACTTATTT 

AGTAGAAATC 

TGGATTTTTA 

TT ATATGTTA 

AGAAGCGATG 

CAATTATCAG 

CGTTAACGAT 

GTTCCAAGAC 

TGCTAAAGTC 

TGTGCTTTTT 

CGTTGTAATG 

AGAAAAACAT 

GATGCAGCAT 

CaGTGTGTTC 

ACCAATTAAT 



6060 

6120 

6180 

6240 

6300 

6360 

6420 

6480 

6540 

6600 

6660 

6720 

6780 

6840 

6900 

6960 

7020 

7080 

7140 

7200 

7260 

7320 

7380 

7440 

7500 

7560 

7620 

7680 

7740 
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CCAGATGCTT TGAACTTATC GCAATTGTTG AGTGCGAAAG GTATCGAACA TGACTTTATA 7860 
CCTGGATATT ACCAATTCCA TATTTATCCA GTATTTCCGA 7900 
(2) INFORMATION FOR SEQ ID NO: 139: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1984 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 139: 

GTCTAAATAA ACAAAATTAT CATTGATTaC TGAACTGGCA TTTCGAAGTA ATGCTTCAAT 60 

ATCATTCGAA TATTTCTTCA ATTTATGATT GTGAAATAAT TCTTGCATCA AAAATGGTCT 120 

TTGGTCACAT GAATGTGCAT CTGAAGCTAC AAAATGAGCC AAATTACATT CTATAAATTG 180 

TAATGATAAC TTTTGAATGT TTTTACCAAA TCCACCAACT AAAGAACTCG ATGTTAATTG 240 

ACTCAGTGCC CCATTTGCAA CCAATTCATA TAATATTTCC GGATTTTTGG CGATACTTCT 300 

ATTTCTTTCA GGATGTGCAA TGATTGGTAT GTAACCTCTC GATTGTATTT CAAAAAACAA 3 60 

TTGTTTTGTA TAATGTGGTA CTTOGCCCGT TGGAAATTCA ATTAATAAAT ATTTCGAACG 420 

ATTAATACCT TGAAT ACTAC CATTATCTAA GCCTTTCAGA ATCGAATCTG TAATTCTAAT 4 80 

TTCTTGCCCG GGAAATAATT TAATATCCAA TGCTTGAACT TCTGGATGCG TTCTTAACTC 540 

CGCCAATTTC ACAAGCACTT GTTGAAATGT ATTATCATAT CTCGGATGCA AATGATGAGG 600 

TGTCGCTACA ATACTTGTTA CACCTTCATC CTTAGCTTGC TTTAATAGTG CAATACTCTT 660 

3S TTCAATTGTT TTAGGACCAT CATCTATATC AACTAATATA TGGTTATGAA TATCAATCAT 720 

. GATTCATCAG TCCCATAATA TGCATAGTAA CTAGCACTTT TATCTTTAGG CATTCTATTT 780 

AAGACTACAC CTAATAATTT AGCACCTGTT GCTTCAATAA GTTCTTTTCC TTTTTTAACT 840 

40 TCATCTCTAT TATTATTTTC CGAATTAACT ACGTAGACAA CATTGCCGGT AAACTTTGAA 900 

AATAATTGCG CATCTGTAAC TGTGTTCACT GGTGGCGTAT CGATAATTAC AAAGTTATAA 960 

TTCATCAATA ATGTGTCATA CAAATTTGCA AATGCCCTTG ATGTAATTAA CTCTGACGGA 1020 

45 TTCGGTGGGA TTGGCCCAGA CGTCAAGACG TCTAAATCTT GAATTTCAGT TGAGATAATA 1080 

CTGTCTTGAT AAGTTGACCA ATTTAGCAAT AAACTTGATA GGCCTTCATT GTTTGGCAAA 1140 

TTAAAAATAT AATGCTGCGT AGGTTTACGC ATATCCCCGT CTACGATTAG TGTTTTATAA 1200 

CCTGCTTGCG CATATGCAAC TGCTAAATTT , GCTGCAATTG TAGACTTACC TGCGCCTGGT 1260 



SO 
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GATCTTATGC 


CTCGAAATTT CTCGCTAATA 


GGTGACTTTG 


GTTGTTCATG 


GACAATTAAA 






CTTGATGTAC 


TTCyTCGTGT ATTCGTCATG 


GTAATTCCTC GTAAATTAAA ATTTTTGTAT 


i a An 


5 


TGAACCTAAA 


ATAGGTAATC CTAGTTG CGA 


TTCAACATCT 


TCTTCTGTCT 


TAATACGCTT - 






ATCTAATAAT 


TCTTTTAAGA AAATAATCAA 


TATTGCTAAA 


ACAATACCAA 


CAATAATGCT 






GATAACTAAG 


TTGACAGATA CTATTGGAGA 


TACTTTTACA 


GCATTATCAT 


GTGCTGAGGA 




10 


AAGTATCGTA 


ACATTATCAA CACTCATAAT 


TTTAGGCATG 


TCATGAGCAA 


AAACTTTAGA 


t c q n 




TATTTTATTA 


ACAATTTTGT CAGATTCAGA 


TTTATTCCCA 


GTGGTAACTG 


ATACAGTAAT 


174 0 


15 


AATTTGAGAG 


TTTGTTTGAT TGGTTACTTT 


TAAAAATGAA 


TTCAACTCAG 


CTGTTGAATA 


J. o w 


CTCACCATCA 


AnTTCTCTAG ATACTTTATC 


TAGAATTCTA 


GGACTTTTGA 


TAATTTCCGT 


loo U 




ATATGTATTA 


ACAGACTGCA AACTACTTTG 


AACATTTTGG AAAGCTAAAT 


CACTTGAGGA 


1920 


20 


CTTTTTCATG 


TTCACTAATA TTTGAGTAGA 


AGCAGTATAT 


TTGTCAGGCA 


TAACAAAAAA 


1980 


GGTT 










1984 




(2) INFORMATION FOR SEQ ID NO: 140: 








25 


• (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6272 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 








30 


(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 140: 








CAAATCCCTT 


GGTGATGAtA AAtGtATTGC 


TGTGTAGCCA 


AATAATCTTC 


GTATATATGA 


60 


35 


CTGACGTTCA 


ACAACAGCTT GCAATCGTTT 


CGTTGGTACA 


GTTACTTTCT 


TCTTGTTAAA 


120 




GAGAC CAT AT 


TCAATTTTAA GTTGCTCATT 


TTCAAGCATC 


ACCGAAAAGC 


CATAAAATCT 


loU 




TATCATTGTT 


ATAATCGTTC CAATAATATA 


TGCCACTATT 


AATACTAGTA 


AAATGATGAT 


■5 a n 


40 


- TAATACTGAA ATACTTACAA TTTGAACCCA 


TTGACTAATT 


TCATGATTTA 


GCTTCGACCA 


300 




TGGGATCAAC 


TCTCTTACAG CCCCGTAAAT 


CGGTACTAAA 


GCTGCTAACG 


TTACACCAAT 






GGCGCCACTG 


GTCATTGCCA TAAATAGTGA 


TTCTTTAAAA 


TTCATCTGAT 


ATATAGGAAT 


420 


45 


GCGTTTATTT 


TTCTGATTAA GCATACTATC 


AGTGTTCTGC 


ACTTCATCTA AGCGACCTTC 


480 




TGCGATGTCT 


TCCACATTAC CTTCAATGTC 


ATGATT ACAG 


TTGTCATTCT 


TCTCAGCACT 


540 




AGACTTTTGC 


GCCACTTCTG TCTTCAACTC 


TGTTTGCAAT 


TGATCAATAT 


ATCGTTCAAG 


600 


50 


ATATTCACCT 


TGTTTTTTCG AAATAACACT 


TAAGACAATA 


CCATCACTTG 


GTGTTTTGAT 


660 
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AATACGTTTT ATATTTAATT CTTTACGCTT TTTATTAAAA ATACCTGTTG TTAAAATGAA 780 

ATAATTATCC tCAATCCAAT ATCGCGTGTT CATAATT CCG ACAATTTGAG AAATGTATGA 840 

5 ' 

TATTAAAAAG AATACAAATA CAATACCTAT CCATAAATAT GATTCGGGAT TCGTATAATC 900 

AAAATCTTTC AATTGAAAGA TAATGAAAAT AAAAAAGACG ACTATGTTTT GTTTGATAGC 96 0 

ATTGATTATG CCATTAAAAT ATGAAATCGG ATGTAATTTT TGAGGTTCAG ACATCACTTT 1020 

10 

CAACCCCTCT CAAATTCGAC ATAGTTCTCT CTTCGATTAT TTTAACATCG TCATGAGACA 1080 

TCATCGGTAA ATAAATAGTA TGACCTGCAG TCATAAATCC AACTTTATAC AAATTAAGCA 114 0 

1S CTTTACTAAT TGGATTAGAT TTAATCGACA AGTATTGTAA ACGTTCAATT CGACTCGTTT 120 0 

CTTCTTTATA TATAAAAAAT GATGTACGAT ATTGTACACT TAGTTGATCA ACTTTATAAA 1260 

AGCGACAATG ATATTGCCAT AAAGGCTTAA TAAATAATTT TAATGTACTC AGAGCACCTA 1320 

20 AAACCAACAA AATATAAAGT AAGTAATGTG GCCATTCAAA TCTTAACCAT ATAAAATAAA 13 80 

AAATGACATA CACAGCTACA CTCAATATAA ATTCTAAGCC ATTCGTAATG TAGTAATACA 1440 

ACAATGCTGA CTTAGGACTC TTAGTCAACT TAGTATAATC TGACATATAC CCCTGTCCCC 1500 

25 

AAATAAAAAA TTATACGGAT TTATAATCTA TTTCATTTTA TTTTTATATG ATGATAATTA 1560 

TAGCATATGG AATATTTCAT GCTAATTTAT - TCTTCCTAAA GGTACATCTA AAAATTTAAT 1620 

TAAGCAGAAA GTGCTTGAAT TGCTAAAAAG ACACCATGTT ATAATTTTAT CAACATGATG 1680 

30 

CCTTTCATCT ATAATCAATG TTTCATGTTA TCAAGAGCGA TATTTAGTTC AAGGACATTC 1740 

ACATAATCAT TTGTTAACAC ACCACGCTGC TTACGATGTT GAATCAAGTC GGCCACTCTT 1800 

35 GAAGTAGATA GATGACGAGC ATCAGCAATA CGAGGTGCTT GCTTCAATGC ATTTTCGACC IB 60 

GTAATATGCG GATCTAAGCC CGACCCAGAA CTTGTTGCAG CATCTATTGT TACATTTGAA 1920 

TTCCCAAATT TAACATGATG TTTCATGCGT GCTATTAATT CGGTGTTTCC ATTCGATTCA 1980 

40 TTACTTCCAC CTGAAGATAC GCCGTTTTTA TATAATTTTT CAGGATTCAT ATTATAATCA 2040 

ACTGCACTCG GTCTCCCGTG AAAATATCGT GTCTCTGTCC AGTGCTGTCC AATCAATTTT 2100 

GATCCAACTA TACGATTGTC ATACGTAATT AAACTGCCAT TTGCTTGTTG ATAAAAAAAT 2160 

45 

ATTTGACCAA TTAACGTGAT AGCTAACGGG AATAAAAATC CACATAATAC CATAGTTATT 2220 

ATCGTTAAAC AAATACTATT TCTTATCGTA TTGATGGTAC AGGCTCCTTC CTCTTTACAC 22 80 

AAAAAATTGT ACAATCATAT CTATTAATTT AATGCCTAAA AACGGGACGA TTAATCCACC 234 0 

50 

TAATCCATAA ATCAACATAT TATTTATAAA GATTCTATCA ATGCTGTAAC * CCTTTACTTT 24 00 

TACACCTTTC ATGGCAATTG GAATTAAGGC AACAATGATT AATG CATTG A ATATCAAAGC 24 60 
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AATTGTTGAC ATCATTAGTG CAGGTAAAAT 
ACTAAATGTC GTTAATGCAC CTCTCGTCAT 

5 

TATTAACTTT GTAGGATTCG AATCTAAATC 
TGTCCCTGAG TTCATAGCTA ATCCTATATT 
TACCATCTCC TGTCATCGCA ACAATATGGC 

10 

TTTTATCTTC GGGTTTACAC TCTGCAACAA 
TAGCTGCTGT TAAAGCATTA TCAC CTGTAC 

15 ATT CAGTAAA TCGTTCTACA AGACCATCTT 
GCATGACATT GTTTTCAATG ACTATTAAt G 
AGAGAGACTC AATATTAAGA GGAATATTGC 

20 TATTAGGTGC ACCTTTGAAT ACCGATATTT 
CAG CTGTAAA AGGCTTATAT GTGCCATCAA 
GcttCGCTAA TCGTACAATA CTTTTTCCTT 

25 

AAGGAGCGAC TATCAATTTT TCAAGCATTT 
TTCGATTGCC ATAAGTGATT GTGC CTGTCT 
ATACTTCTAC AGCACGCCCA CTTTTCGCTA 

30 

CTGCAATACC AATCGCCGAT AACAAACCAC 
ACGCAATGAG CATCGCAATA GGTAAAATTA 

35 . TTACAATAAC GACTAAAAAT. ATAATTGTTA 
CATTTGGTGT TTTATTTCTT TCCGCCCCTT 
ATGTACnCGC TTCACTCTCA ACACGTATTT 

40 CAATGACTCC ATCAAAATCG CCACCTGATT 

TTGCAGATTC ATCAACGGTT GCTAATCCAT 
CTCCATTTTC TACCCGAATA TTTTGTCCGG 

45 

ACGCACCATT TTCTTCTATC AATGGAGCAG 
CAGCTTGCGC TTTTCCACGA CCTTCAGCAA 
TTATTAATAA TATGATAAAA ATTGTAATCA 

SO 

ATATGTCAGG AAAACATATT AATATCAACG 
TTATCGGATT TTTTATTAAT TGTTTAAGAT 

55 



TGCAAAGTAT TTTGCTACGT CATTAGCCAA 


2580 


TAATAATTGT 


TTGCCTATTT 


TTACAACCTC 


2640 


AATTAGATTA GCTGCCTCTT TAGCACTAAT 


2700 


CGCTTtGTGc 


tAGCGCAGGT 


GCATCATTTG 


2760 


CTTTCGCTTG 


TTCATCTTTG 


ATGACTTTAA 


2820 


ATCTATCAAG 


CCCGGCTTCT 


TTTGCAATTG 


2880 


ACATAACTGT 


TTCAATCCCC 


ATTTTTCTCA 


2940 


TAATCACATC TTTTAAATAA ATCACGCCAA 


3000 


GnGTGCCACC 


TTTACTCGAT 


ACATCGATAC 


3060 


CTTGTTGTTG 


TTTGACAAGA 


TTTATCATAC 


3120 


CATTTGTAAT 


GATTCCGCTC 


ATTCTAGTTT , 


3180 


TGTCTTTAGG 


CAGCTCATTT 


ATATACATcT 


3240 


CTGGCGTATC 


ATCGTAGATT 


GATGACATAT 


3300 


GTTGATTCAC 


TGGTAAAAAT 


TCACTAGCGA 


3360 


TGTCTAAAAT 


CATTACATCG 


ACATCTCCAC 


3420 


ATACATTGAA 


TTGAGTAACA 


CGATCCATGC 


3480 


CGATTGTCGT 


TGGTATTAAA 


CATACTGTTA 


3540 


AATGCAGGTA. AGATGCTATT .GGATATAACG 


3600 


ACGTTGTTAA 


TAATGTAAAA 


AGTGCAATTT . 


3660 


CAACTAAGGC 


AATCATTTTA 


TCTAAAAAAG 


3720 


CTAACCAATC 


AGATGTTACA 


AGTGTACCGC 


3780 


CTTTTATCAC 


AGGTGCAGAC 


TCACCAGTAA 


3840 


TTATTACAAC 


GCGATCAGCA 


GGGATTGTTT 


3900 


CTTTTAACTC 


TGTGGCGTTC 


ACTATCCGAT 


3960 


TTAAATTTGA 


TTGTGCTTGT 


CTTAAACTAT 


4020 


AGGCTTCTGA 


AAAATTAGCA 


AACAATATAG 


4080 


AATAACCTCG 


CGATAGATAG 


CTAGTTCCAA 


4140 


TTAAAATCAT 


TCCAACCTCA 


ACGACAAACA 


4200 


TCAGCTTATA 


AAAACTCATT 


TTCAAAGCTT 


4260 
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TTTATTTTAA AGTTAAAAAT TCACCAATAG GACCAAGTAA TAGTACTGGA ATAAATGTCA 4380 

AACCACTTAG TAAAACGATA AATACGATTA GTGATACGCC AAAATAAGGT TTATCAATCG 4440 

5 

CTATTGTATA TTTATCTTGA TGGTATGATT TTTTATTCAC TAAACTTGAT GCAATCATTA 4500 

ATTGCAAAAT AATTGGTATA TAACGAGAAA GCAACATAAT GATTCCTGTA GAGATATTCC 4560 

AGAATGTTGT ATCATCTTTC AGTCCTTCAA ACCCTGATCC ATTGTTCGCA GCAGCTGATG 4620 

10 

TCATTTCATA CATAACTTGT GAAATACCAT GAAAAGACGG ATTCGTtATa CTTtCACTTG 4680 

CTCCAGGAAT CATAAAAGCA AGTGCTGAAA ATACTAAAAT TAAAATTGGG TGTATGAGAA 4740 

1S AGACTAAGAC AATACATTTC ATTTCACGGG CGCCAATtGG CATATTTAAA TATTCTGGTG 4800 

TTTTACCAAC CATCAAACTG CATATAAACA CCGTCAGTAA GACAAATATC AATAAATTCA 4860 

TGAGTCCTAC GCCTTCGCCA CCAAATACAA CATTTAGCAT CATTAATACC ATTGGTCCTA 4920 

20 ATCCACCTAT AGGCGTTAAG CTATCATGCA TGTTATTAAC AGAACCCGTT GTAAATGCCG 4980 

TCGTAATAAC TGTAAATAGT GCTGACAAAC CTGCTCCAAA CCGTACCTCT TTACCTTCCA 5040 

TATTCGGTCC ATAAATGCCT AAATTCGCTA GTATTGGATT ACCACGATAC TCACTCCACA 5100 

2S 

TAGTTAATGT AAGAATTGCT ATAAAAATGA AAAACATTGC GACAAATAAT ATCAACGCAT 5160 

GACGATGTAC TCGTTTACCA TGTGTACTTA ACATGCGACC AAATAAGAAC AACATTGACA 5220 

TAGGAAGTAA CATCATACTG CCCATTTCTA TAAAATTGCT CCAAATATTT GGATTTTCAA 5280 

30 

AAGGTGTTGC AGAATTTCCT GCTAAAAATC CTCCACCATT CGTACCAAGA TGTTTTATTG 5340 

ATTCAAGTGA TGCAATAGGT CCAAATGCAA TATGTTGAAT ATGTCCGCTT AAAGTCCGAA 54 00 

3S , TCATTAAATT AGCATGCAAC GTTTGTGGTA CaCCTTGAGT CATCAATAAA ATACTAATTA 5460 

AACATGATAA TGGTAAAAGT ACTCGGACAA TAAACCGAAC AATATGTTGA TAAAAATTAC 5520 

CAATGATATT AGTTAATCCA GTTAAACGTC TCAACATCGC TATACAAACG GCGTAACCTG 5580 

40 ATGCACTAGA TGTAAACATT AAATATGTCA TTACAATCAT TTGCGTTAAA TATGTCACAT 5640 

CTGaTTCACC GTTATAGTGT TGtAAATTAC TATTTGTTAA AAAAGATATT GCTGTATTAA 5700 

ACGCTAAATC TATCGATTGG TTTAAATTAT GATTTGGATT TAAAAAAAGC CATTGCTGAA 5760 

45 

CTATTAGCAA TACAAATGTT ATAAACCCCA TAAATCCATT AAATGCCAGA AAATGTTTGA 5820 

CAtATGTTTT AGCTGACATG TGTTCTAAAT CTGTGCCGAT AATTTTAAAA CACATATTTT 5880 

CAAATCTAGT AAATATTAAA TCTACTCTTG ACGATTGCAC CAATGCTACG CGATATAGAT 5940 

SO 

ATCCACTAAA AACATACGTA ATCATAACCA TCATTGTTAG AAACAAAATT ATTTCCATGA 6000 

TAACCCTCAC TTAATATATT TCTAAAATTT TTCACTACGA ATTAAGGCAT AAAATAAATA 6060 
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ACACAACAAC ATCGTAACAA CTTGTTTATG AGAGAAATnT TAATTTTCAA ACTTAGTTAT 6180 ; 

TAAGAAAnCA TTAAGATGTG TATGCAGAAA TAAATTTTAT AGCATTTAAT TGTGAAGAAT 6240, 

5 ATTATGATAT TGCTATCGAG GTGAAGGTTA TG 6272 

(2) INFORMATION FOR SEQ ID NO: 141: 

(i) SEQUENCE CHARACTERISTICS: 
10 (A) LENGTH; 197S base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

15 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 141: 
AAATGATGTT TTACAATAAA TATAnAAACG TATCAACATA TATCATCATA TTTTTAGTTT 60 
20 CAAGTGCAGC CTTTGCAATA TTCTTGTTAA GTGCGnACAT TAGTGCTCAC „TCGGAACAAG 

TGTACGAAAT GACTGACCAT CAAATTAAGA ACAATACGAT AAATAAAGCA TACGAACATA 
AAGACCCTAC AAACAATAGC GAACAAAGAG ATGGGAAAGT GTTCGCTTTA ATAAATTGAT 
26 ACATTGTCAC AACGTTATTT TGCCTATTTT TGCGmAATAG CGTTTTTTAT TACwTTTTTG 300 

CTGATsTTAA ATTTGTTATA TTTTGTTAAA GTATTATAAT GATTGAATAA ACAAATTGAA 360 
GGTAGGTTTT TTAATTGAGT AATTCTGATT TGAATATCGA AAGAATTAAC GAGTTAGCTA 420 
30 AAAAGAAAAA AGAAGTAGGA TTAACTCAAG AAGAAGCAAA GGAGCAAACA GCCTTAAGaA 480 

AAGCTTATCT TGAGAGTTTT AGAAAAGGGT TTAAACAACA AATTGaAAAT ACTAAAGTAA 540 
TTGATCCAGr AGGTAATGAT GTAACACCTG AAAAAATTAA AGAGATACAA CAAAAAAGAG 600 
ATAATAAAAA TTAAATCACA AATCTGTAAA GAATTTTCTG ^ ACATTATAAC TTGAAATAAG 
TATTfTTACTT ATCTTTTTAT TTTAAAATAA GTTATAATGT ATTTGATAAA ATTGAAGAAG 
- GGAAGATACA CAAGATGTTT AATGAAAAAG ATCAATTAGC TGTTGATACG CTACGTGCAC 
TAAGTATCGA CACAATCGAA AAAGCGAATT CTGGTCATCC AGGATTACCT ATGGGAGCTG 
CCCCAATGGC TTACACTTTG TGGACACGTC ATCTGAATTT TAATCCACAA TCTAAAGATT ? 
45 ACTTCAATAG AGACCGTTTC GTATTATCTG CAGGGCATGG TTCAGCATTA TTGTATAGCT 960 

TGTTACATGT TTCTGGTAGT TTAGAATTAG AAGAATTAAA GCAATTTAGA CAATGGGGTT 1020 
CTAAAACACC AGGTCATCCT GAATACAGAC ATACAGATGG TGTAGAAGTT ACTACCGGAC 1080 
CACTTGGACA AGGTTTTGCT ATGTCAGTAG GATTAGCTTT ACAGAAGATC ACCTAGCAGG 1140 
gAAATTTAAT AAAGAAGGAT ATAATGTTGT AGAT CATT AC ACATATGTAT TAGCTt CTGA 
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AAGTAAATTA GTTGTTTTAT ACGATTCAAA TGATATTTCA TTAGATGGCG AATTAAACAA 1320 

AGCTTTTTCT GAAAACACAA AAGCTCGTTT TGAAGCATAT GGTTGGAATT ACTTACTAGT 13 80 

TAAAGATGGT AATGATTTAG AAGAAATTGA TAAAGCGATT ACTACAGCTA AATCTCAAGA 1440 

AGGACCAACG ATTATTGAAG TTAAAACAAC AATCGGATTT GGTTCACCGA ATAAAGCAGG 1500 

AACTAATGGT GTTCATGGGG CAC CTTTAGG TGAAGTTGAA AGAAAATTAA CATTCGAAAA 1560 

TTACGGTTTA GATCCTGAAA AACGTTTTAA TGTTTCAGAA GAGGTATACG AAATTTTCCA 1620 

AAATACTATG TTAAAACGTG CTAATGAAGA TGAATCTCAA TGGAATTCAT TATTAGAAAA 1680 

ATATGCAGAA ACATATCCTG AATTAGCAGA AGAATTTAAA TTAGCGATTA GTGGTAAATT 1740 

GCCTAAAAAT TATAAGGATG AATTACCACG TTTTGAACTG GGTCATAATG GTGCATCTCG 1800 

TGCTGATTCT GGTACTGTTA TTCAAGCAAT CAGTAAAACT GTCCCTTCAT TCTTTGGTGG I860 

ATCAGCAGAC CTTGCTGGTT CAAACAAATC CAATGTAAAT GATGCAACTG ATTATAGTTC 1920 

TGAAACACCT GAAGGtAAAA ATGTGTGGTT TGGTGTACGT GAATTTGCTA TGGGTGCT 1978 
(2) INFORMATION FOR SEQ ID NO: 142: 
25 . (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7588 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 142: 

TAGTAGTATT TATTAAATTA TACGAAGGGA CCcAACACAG AAAATTCATT TTATTGAATT 60 

TTACATTTAT GTGCCAAGTT GGGAAAAATG TCTTATTTTT TCaAAGTATT TAAAAGTAAA 120 

ATTACATGTT AATACGTAGT ATTAATGGCG AGACTC CTGA GGGAGCAGTG CCAGTCGAAG 180 

ACCGAGGCTG AGACGGCACC CTAGGAAAGC GAAGCCATTC AATACGAAGT ATTGTATAAA 240 

TAGAGAACAG CAGTAAGATA T TT TCTAATT GAAAATTATC TTACTGCTGT TTTTTAGGGA 300 

TTTATGTCCC AACCTTTTTA GAATATTAAA TTTCTACAAT TTCGTCATCT TCAACAATAA 360 

45 AGCCCATTGT ATTGACGCTG TTATTTAAGA AAGTCAGAAT ATAACGCATT ACTTCATCAC 420 

GTTCTGGCTC ATTGTGAACC TCGTGGTAAA AACCTTGCCA AGCTTTAAAA TATAATTCAG 480 

GTGTTTGATA TTTTTCTTTA AACTCATCAA TTGCCCTAGT ATCAACAATT AAATCCTTCG 540 

50 TTCCATACAT TAATAGCGTT GGCATTGGTT GAATGT CATG AATATGAGCC ATCGTATCTT 600 

TCATCGTCTC ATTAATTGTA TTATACCAAT GATACGTTGC TTTTTTTAAC ATTAAACCAT 660 
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CATTAAAACG 
TTTTTCCATT 
ATTCTACTTT 
AAGTAGGAAT 
TTTGAAAGTT 
CTCCCATAAT 
CCGTATGTTC 
CCCACTTCCA 
AAATTCACTA 
TGAAATCAAC 
AACGCTTTCT 
GTAGCAATGG 
AACGCAGCAA 
ATTCCAGAGT 
GACAATTTAG 
TTAACAATTA 
AGTCAGTTAG 
CTTAAAGCAA 
CTGCAACAAA 
GTAATTCAAG 
TTACGTTTGG 
GACGTAGATG 
ACTTCAATTG 
AATCACATTG 
GCAGAAGAAA 
TGGTTTGCGT 
AAAGAATTTG 
ACAGTTATGT 
ACAATAATTT 



TGTGTCTTTT 
CTTTT G AAGT 
TTCAAGTAAA 
TTTATATTCA 
TTCAATTTGT 
CACATGATAG 
TAATATATTA 
CATTATTATA 
TGTAGATTTC 
ATCAATAATA 
CGAATATTTT 
CACTATTAAA 
AAAAAGTGGG 
TAATTAATAC 
GGGAATTTGT 
TGGACGCGCT 
GTGCAGAATT 
ATACTTACAA 
TTGTTCAAGT 
CATATTTATA 
TTAAAGGTGC 
CAAATTACAT 
CAACACATGA 
AAAAAGATCG 
TCGCAAATGA 
ATTTTATG AG 
TGAAACCTGC 
TAGGTTTAAG 
AGGAGTCTGG 



GAAATTTTAC 
TCTAGCATAG 
TTTAATAAAA 
TTAGCTATCT 
CCTTTATTAG 
CCATTTCTTC 
TGAGCAATAA 
CTGCCCCTTT 
TATTTATAGT 
GTGTAATTAT 
TTTCATGCTA . 
GAATTTTTTT 
CCCACGTTTG 
AATCGAATAC 
CGGTACAGTT 
TCATCAACAT 
CGACTTAGAA 
CAATATGCAT 
TTTAGAT CGC 
CGATAGCCAC 
ATATAAAGAA 
CAAAATAATT 
CCATCGCATC 
TATGGAATTC 
AGGCTATAAT 
AAGATTAGCA 
TGGCTTAAAA 
TACAATT/^AA 
AACAATAATC 



CTATATTTGA 
GAGAAATTAA 
TCAAACCGCC 
TTAACCAGTC 
CTCTTGAAGT 
TTAACATCGT 
CAACGACGCC 
TTCATTAATC 
ATTATTGTTG 
ACATAATTAT 
AACTTATTGT 
ATGGGATTAT 
GGCGCCAATA 
TTAAATGACA 
GAAGAAAGTA 
GGCGTAAAGG 
TTAGCTTACC 
ATAAATATTG 
TTAAAAGGCG . 
GAATTAGTTG 
AACGAATCAA 
GAACAACGTT 
ATTAATCATG 
CAAATGCTCT 
TTCACTATTT 
GAACGCCCAC 
CGTGTTGGCA 
AAATTATGCC 
AATGTTCTAG 



AACAAGTTTA 
CATCATCCCC 
AAGTCCTACC 
TAGCAAACTT 
TTGAC CTTGA 
AATAACATAT 
TTTCGCATCA 
TTCAATAACA 
TCCATATTAT 
TTTTGATTGT 
AAACACAAGG 
CTAATAATAG 
AAGTCGTTGC , 
AGAATATCGC 
ATCATGCTAA 
CACATATGTC 
AAAATTTAAG 
ATACTGAAAA 
AATTTAGAAA 
ATAAGTACCA 
TTGCATTTCA 
TGTTAAACGC 
TAAAACAATT 
ATGGTTTTAG 
ATGTACCTTA 
AAAACCTATC 
TAATTGCAGC 
GTAAATAGAG 
GCTCCTAAAT 



TCTTTACGAT 
TCGATTGGCA 
CCTAATACAT 
TCGTGATACG 
CCAGGCAAAT 
GCATATCTTC 
TTTTCAGCTT 
TAATTATAGC 
TATATATAAA 
TTTTGATGAA 
GTTTGGAGGA 
TTTTTTAAAC 
, CGGAAATACA 
TGTTACGGTA 
AGAACAAATT 
TGTTAAATTG 
AGAGATTTTA 
ATATGCTAGC, 
TGTTGGTACT 
AGATTTACGA* 
ATCTAAGGAA 
ACGCAATTTC 
TATGAAAGAA 
ATCAGAGTTA 
TGGCGATGAT 
TCTTGCTGTA 
TTTAGGAGCT 
CAAGAGATAA 
GTTATATTGG 
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2100 
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2220 
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TAGATTTTAA TAAATTAGCC ATTTCAATTG CACTTACTGC TGCTTCAGCA CCTTTATTGC 2580 

CAGCTTTCGT ACCTGCTCTT TCCACAGCTT GTTCAATAcT TTCAGTCGTT AAAATACCAA 2640 

ATATGACTGG TACATTAGTT TGATCATTCA CTTTAGAAAC ACCTTTCGCG ACTTCATTAC 2700 

AAACATAATC ATAATGAGAC GTAGCACCGC GAATTACGCA TCCTAATGTA ATTACTGCAT 2760 

CATAATTTCC TGATGAGGCT AATTTTTTAG CTACTAAAGG AATTTCAAAC GCACCTGGCA 2820 

CAAATGCTAC ATCAATATTG TCTTCATTAA CATCATGTCG AATCAAAGTA TCTTTTGCAC 2B80 

CTTCAAGTAA TCTTCCAGTG ATAAAATCAT TAAATCGACT AACTACGATT GCAACTTTCA 2940 

AATCTTTTCC AATTAATTTA CCTTCAAAAT TCATGTTAAA ATCCTCCTAT ATTAAATGAC 3000 

CCATTTTTAT TTTTTTCGTT TCCATATAAT CATGATTATG TACCGTTTCT GGTACGATAA 3060 

CTTCAATTCT TTCTGCAATA TCAATGC CAT ATTGTTTTAA TCCCTCAAAT TTACTTGGAT 3120 

TATTACTTAA TAAATTGATA TGTTCGATGT TAAAATATTT TAAAATCTGT GCAGCAATAT 3180 

GATAATCTCG CAAATCTTCA TCAAAACCTA ATGCTAAATT TGCAGTTACT GTATCATATC 3240 

CTTG CTCAAT TAATTCATAT GCGCGTAATT TGTTTAACAA TCCTATGCCA CGACCTT CTT 33 00 

25 GAGGTAGATA AATAATCATG CCACCATGTT CATTGATATA CTTCATAGAC GATTCAAGTT 3360 

, GAGCACCACA ATCACAACGT TGACTATGGA AAATATCGCC TGTAAGgCAC GCAGAATGTA 34 20 

AGCGTACATT TTCATGTTGT CGAATTGCAC CTTTTGTCAG TACAACTATC TCTTCATCTG 34 80 

TGTATGTCGC TTTAAAACCA TACATATCAA ATGTTCCGAA ATCTGTAGGC ATTTTCACTT 354 0 

TTGCCTTAAA TTCAATTTCT GGTTCTAATT TTTTACGATA TTCAATTAAA TCATCAATCG 3600 

TAATCATCTT TAATTGATGT TTTTCTTTAA ACTTTTGTAA ATCTTGTCCT TTCGCCATCG 3660 

. TGCCGTCATC ATTCATAATC TCACAAATGA CAC CAG CGGG CTTGGCACCA GTAAGTTTAG 3720 

CTAAATCAAC AGCCGCTTCT GTGTGTCCAT TTCTAG CTAA TACGCCTTTA TCTTGTGCTA 37 80 

CTAATGGAAA TAAATGACCA GGACGATTAA AATCTTTAGC TTCACTACTA GGATCAATGA 3840 

GCTTTTTGGC AGTCAATGTA CGTTCATAAG CACTAATTCC TGTTGTTGTA TCTACATGAT 3 9 00 

CAATACTCAC TGTAAATTG C GTACCAAAGA TGTCGGAGTT ATCATCAACC ATTTGTACCA 3960 

45 AATCCAAACG TTGTGCAATA TCTTTAGACA CTGGTGCGCA TATTAATCCC CtTGCTTCTT 4 020 

TCGCCATAAA ATTAATGGTA TTATCGTTCA TCCATTCAGT AACCGCTACT AAATCACCTT 4080 

CATTTTCACG ATTCTCATCA TCTACTACAA TAATTGGTTC TCCATTTTTT AAAGCCATTA 4140 

50 AAGCACTGTC AATATTATCG AATTGCATGC TACCCCTCCt AAAAACCAAA TGCTCTTAAT 4200 

TTATCTACAG ATAATTGGTC TTTATCTTTA TTTAAAATAT TTTCAACATA TTTAAACAAA 4260 
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CTCGTTTCTG 


GAATAAGATG 


AATGTCAAAA 


CTGTTATCAT 


GCTTATCAAA 


TACCGTTAGA 


4380 




CTAACACCAT 


CCACAGTAAT 


AGACCCTTGC 


TTAACTAACT 


GATTATTAAT 


ATGTTGGCTA 


4440 , 


5 


CATTGAATCG 


TAATAATTTT 


TGCATTGGCT 


GTTTCATTTA 


TTTTTGAAAC 


TGTTCCTAGT 


4500 




TCATCTACAT 


GACCGAGGAC 


AAAATGTCCA 


CCAAACCTAC 


CGTTACCACT 


CATGGCACGC 


4560 




TCTAAATTTA 


CTTCTGATTG 


TCGCTTAACA 


TCTGCTAAAT 


AGGTTTTATT 


TTCAGTGCCT 


4620 


10 


TTAATTACTT 


GAACAGTAAA 


AGATGTCTGA 


TTAAAATCAA 


TCACTGTTAA 


ACATGCACCA 


4680 




TTAACACTGA 


TGGAATCACC 


AATATGCATA 


TCTGCCGTAA TCTTATGTGC TTCAATTTCA 


4740 


15 


ATCGTCCTGA 


CTGATTGACG 


AATTTGAACA 


CTTTTAACGA 


CACCTATTTC 


TTCAACGATG 


4600 


CCAGTAAACA 


TGCAT CAT CA 


CTTCTTTCGT 


AAAGTTAATT 


TAACATTTTG 


ATTTAATAAC 


4660 




TCGGAATGAA 


CAATTTCAAA 


TTGGTTCGCA 


TCTGGTATCT 


CAATCACATC 


ATTTGTTTGA 


4920 


20 


TAAAATTGAT 


AATTTCCAGA 


TCCGCCAATT 


AATTTCGGGG 


CATAATAGAG 


AATAAATTCA 


4980 




TCTATATAAT 


TAGATTGGAG 


AAATTCTGAA 


GTAGTGGTTG 


GACCTGCCTC 


GACTAGCAAA 


5040 




GTTCCAACTC 


CTCTTTTATA 


TAAATTGTGA 


AGAATTGTTG 


TTAAATCGCA 


AGACTTCAAG 


5X00 


25 


• TAAATAATTT 


CAATATGTGT 


TTGATTGGTT 


GTTAAATTTG 


GATTTTCAGT 


ATATATCCAA 


5160 




ATTGGTGTTG 


ATTCATCTTG 


AT AAATTTG C 


TGATTAAAAT 


GAATATTCCC 


AGACTTAGAC 


5220 




AATATTACTT 


TTATAGGGTT 


TTTTCCATCT 


TGAATACGTG 


TAGTATATTG 


TGGATCATCT 


5280 


30 


AATTCAACTG 


TACGTCTTCC 


AGTTAACACT 


GCGTCGTGTC 


GATGTCTTAA 


CTTATAGACA 


5340 




TCTTGTTTAA 


CCTCTTTGTT 


AGTAATCCAT * 


TGACTTTGTC 


CATTATCATT 


CGCTTGTTTA 


5400 


35 


: CCATCTAAAC 


TTGCAGATAC 


TTTCACTGTA ATTTGTGGCA GTTGCTTTGC -TTTTGCTTTA 


5460 


AAAAAGTCTT 


GGTATAATTG 


TGATG CCCGT 


TCATCATCAA XCGCATTCAAC 


CTCAATACCG ' 


. 5520 




TGAGCCCGTA 


ACGTCTCATC 


ACCATGTGTG 


TCTAACGAAT 


TGTCTTTTGT 


TGCGTATACT 


5580 


An 


ACTTTTGCTA 


TCTTACAATC 


AATTATTTTG 


TTAACACAGG 


GTGGTGTTGA 


ACCAAAATGA . 


5640 




CTACATGGCT 


CTAACGTAAT 


ATAAATCGTC 


GCACCTTCAG 


CATTTTGTTG 


TGCCATATCA 


5700 




AGTGCTTGAA 


CCTCCGCATG 


CTTGTCACCT 


TTTCTCAAGT 


GTGCACCAAT 


ACCAACAATC . 


5760 


45 


CTACCTTCTT 


TAACTACAAC 


AGCGCCAACG 


GGTGGATTAA 


CACCTGTTTG 


ACCTTGTACC 


5820 




ATATTTGCAA 


GTTGAATCGC 


ATAATCCATA 


AATTGACTCA 


AATGATCACC 


TCTATAAACA 


5880 




AAAATCCTCA 


CATCATGAAT 


TAAGATGCAA 


GGAGaAAAAT 


TTATCGTTAA 


ATAAGCCTAT 


5940 


50 


TTGTACACAT 


TTTTACAAAT 


ACGCTACATT 


ATCTTTGTCG 


ATAATTAACA 


TTCTTTCTCC 


6000 




CATCCAGACT 


TTAACTGTCG 


GCTCTAGAAT 


CTCACTAGAT 


CAGCCACTAA 


TATGAAACAT 


6060 
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TTaTATATGA AATTGTTATA GATTATTTGA GTACGTAGTA TGTCAACTAC ATTTAAAATG 6180 

ATACTATATG TTTTCTGAAA AAACAATTAA TGAGGGTTTT AATTTAATAT AATCTGAGTA 6240 

CTATAGGCAT CTCATTGATA TGATTCTTAC TAACAGACAT TAAAATGAAA CCTTCAATTC 6300 

GTCTCTATAG AGCGTTCTCT TTATTATCTT CTAGTTACAA ATTATTGATT GtCACtGCGC 6360 

TGTTGTTGCT CATTCGATTC TAAAGCATCA TATAATTGAG ATACTGTATG CGCAACTTGT 6420 

TCTACAATCA TTTTCACACC GTTTCGTAGT TTATTAACAC CGTTTGTCAT TTGACCTATC 64 80 

GCAATCATAT TTGTTAATGT TCCAAACCTT GGACTAATAA CTTGATTGGT TTCCGGAATG 654 0 

ATTTGTATGC CTCCCATTGG GTGTGCTTGT ACAATTTGTC TATTTTCAAG ATTTCTAATT 6600 

AATTGATCAT CTTGATCGAA TTCATTTAAA TGACTTTTTG CACCTGTCGC GTTAATGACA 6660 

ACATTATATA TGTCTACTGA TTCTTGGTTT TTGTATGAAA AATAATACAA CTTGGCATaC 6720 

ATGTTCACAT CTTCTAAATC TTTTTTCAAA ATTAAAGACT TATTTTCTAT TAATTCAATA 6780 

ATTAGTTCAG CAGTTCTTGG AGGCATTGGA TTTGAATTTA ATTGAATCAT CTTTGAGTAT 684 0 

TTTTGATTAA ATTGATGTTG GTCTTCAATA CTTAAGCTAT TCCATATCCA ATTTAAATTC 6900 

TCTTTCAAAT GTTCAATCAT ACTTTGGAAA ATGCCCaTTT CTGTTGGACG CGCTAAATCA 6960 

TACTTCAAAT CTGCAATATG ATTTC CTGTA CGTCTATGTA CTAATTTTTT AAAATCAATG 7020 

TCATATTCAG CACATTCTTT TAAAAATAAA GAAACTAAAG TATCAAGCGG TGCATTGCCG 7080 

AAATGATGTT TTTTAATGTC ATTTAATTTG TCTTTAGTTA AGTACTTGAA TGTCACGTCT 7140 

ATCATTGTAC CTCTTACACT TGGTAAATGA GCAGAACGAC TCGTCATAGT AATTGGTAAT 7200 

TTTGGATGAT GAGCAGCAAC ATAACGGACA ACATCTAAAC TGGGAAGGCC TGTACCAATA 7260 

ATCGCAATAT CGTCCAGTTC ATTTACTTCG TCTAACGTAT TATATGTTGG ATAAGGCGTA 7320 

gcG^ATATC CTTTTTTACC CTTTAAGTTA TATGGATCAT GGTAGGGAAA TGTACCACAT 7380 

GTTAAAAATA CATAATCGTA CGCTTGCCAT GATTGTCCTG AATTTGTAGT ACATATGTAA 7440 

TAAGTTAAAT TCGTTTCATC GATATTAGAA TTTGTATAAA TCTCTTGAAC TTTATTATAA 7500 

TTAGTTGATA TATTTGGATA TTTTTTCGTG AACATAGATA AATAAGATTT CATATAATGT 7560 

CCGAATACAA ATCTCGGTAA ATATGCAG 7588 
(2) I NFORMAT I ON FOR SEQ ID NO: 143: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10320 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 143: 



5 



10 



15 



20 



nCTAGGTATT 


TTAAACCTAA 


TCTAGATAAA 


CTAGCTTCGT 


AAGCAGCTGC 


TACATTTTCA 


-60 


CGACCGAAAT 


CCTCAAAATA 


TAATTTTGAA 


GTAATAAATA 


AGTCTTCTCT 


AGCAATACCA 


120 


GTTGACTCCA 


ATCCGGCACG 


AATGCCAGCA 


CCTACTTGTT 


CTTCATTCCC 


ATAAACTTTT 


180 


GCGGTATCAA 


TACTACGATA 


TCCTTGTTCA 


ATGGCATACT 


TAACACTTTC 


CATGCAATTT 


240 


TCATCATTTT 


CCACACGAAA 


TGTCCCTAAA 


CCAATTTGTG 


GCATCGTGTT 


TCCATTATAA 


300 


AATGTTTTAA 


CCTCCATAAA 


TATCGCCTCA 


CCTTTTTGAT 


GTATTATACC 


CTGTTAT CAT 


360 


AACAAATCTG 


AGTTGAATAC 


ATGAGAAAAA 


ACACTTAGAG 


CAATCAACCA 


CTAAAATTCT 


420 


AGTAATATCT 


CTCAAATATT 


AATCAAATTG 


TAAAAGTAAT 


TCTGTTTAAT 


TTATGACAAA 


480 


CTAAAAAAGC 


CGAAGTAACA ACATATAGTC ATCACTTCAG 


CCTAACATTT 


AATTGAATGA 


540 


TTCAATTTTA 


TCCATCATTT 


GTTGTAAGTC 


TTCCACGTTG 


TATTGAATAC 


GACCATGGAA 


600 


TACAAATTTG 


TTAAAGAACT 


CGTCTAATTG 


TTCAG CACCG 


ACAAGCACTT 


TGACAGCACT 


660 


ATTTTGATTA 


TAATTTGAAA 


TCGTTACATC 


GCCTTCATTT 


TTAAGATTAA 


AGTATAAAAT 


720 




GTATATTTGG 


CACCTAATTC 


TTTTTGTAAG 


TCTTCAGC CA 


ATTGTTTAAT . 


780 


CGCCTCAATT 


TGATCTGAAT 


AATTTACAAA 


TGATAATGAA 


CGTTTGTCAT 


CATTTTGATC 


840 


CATCACAATA 


GTTTGCGGTC 


TAGATTTATC 


TAAATCCAAT 


GTATCAAATA. 


CTTGTTC CAT 


900 


TGGTGGTAAA 


TCTTTAAATT 


GACCGCCACT 


AATACCATTA 


TAAACATGAC 


CTTTTAACAA , 


: % 960 


TTGAGAATCA 


ATAATATAAA 


GACCAGTTCT 


TGTTAATACT 


AAATGACTAA 


TTCGTTCAAT 


1020 


ATTATTAAAG . 


CCATCCTTTG 


GTAAAAAGAT 


ATTTGCCATA 


ATGTGCATAT 


CTTCTGGTCG 


.1080 



35 

AATTCGTTTT TCTTTAACTA ATCTTT CACG AATACCAATT AATCTCATGT CCGTTACATA ■ ; v 1140 

TTC^TATGA TTTTTCGAGA ACAATTTTAA TGCGTCAATC TCACGATCTT TTGTACTAAC 1200 

CATGTGATTA TAATCTTCTT GTTGTTTTGT AATTGTCTTT TTATTTTGAA TACGCTCTTT , , 1260 

40 

CTCTAAAGCT TCTTCATGAG ACTTTTTAAT GTTTTGTTCT TGTTGTTCAT ACTTTTCTTC 1320 

TGTTTGTCGC TTAACTTTTT TCTTACTACC TAAGGCAACT AAAAAAAGGA CAAAAAAGAT 1380 

45 TAATGCAATG AgCTACTGCA ATAATGAGTC CAATGACTAT CGGTGAAGAT AAATCCATCA 1440 

CAACAACGCT CCTTTTTAAT ATATGAATAA CTTTAATTAT AATAGAaAAG CTAAAGATTT 1500 

TCGATACATA TTATCATTTA TATACCGAAA ATCTTTTATT TAGCTATATT CAATTCATCT 1560 

SO TATTATTTTA CTGCGTCTTT TAATTCTTCC ACTTTGTCTA ATTTTTCCCA TGGGAATAAG 1620 

ACATCTGTAC GTCCAAAATG ACCATAAGCA GCAGTTTGTT TGTAAATCGG TTGTTTCAAA 1680 
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AGTTGCCCTT 


CAGAAACTTT 


ACCTGTTCCA 


AATGTATCAA 


TTGCAATTGA 


CACTGGTTCT 


1800 




GCAACACCAA 


TCGCATATGC 


CAATTGTACT 


TCACATTGAT 


CTGCTAAACC 


TGCTGCAACA 


1860 


5 


ATATTTTTAG 


CCACATAACG 


TGCAGCGTAT 


GCAGCTGAAC 


GGTCTACTTT 


TGTAGGATCC 


1920 




TTACCACTGA 


AGGATCCGCC 


ACCATGACGT 


GCATAGCCAC 


CGTACGTATC 


AACAATGATT 


1930 


10 


TTAGGTCCTG 


TTAATCCTGC 


ATCACCTTGA 


GGTCCACCGA 


TTACAAAGCG 


TCCTGTAGGA 


2040 


TTGATGTAGA 


ATTTAGTTTG 


TTCATTAATC 


AAGTTTTCTG 


GAACAGTTGG 


ATAAATGACA 


2100 




TGTGCTTTAA 


TGTCTTCTTG 


AATTTGTTCA 


AGTGTCACAT 


CCTCAGCATG 


TTGTGTTGAT 


2160 


15 


ACGACAATCG 


TATCAATACG 


TACTGGGTTA 


TCATTTTCAT 


CATATTCAAC 


AGTGACCTGA 


2220 




ACTTTACCGT 


CTGGTCGTAA 


ATAATTTAAC 


GTACCATCTT 


TACG CACATC 


TGATAAACGT 


2280 




TTTGCCAATT 


GATGTGATAA 


ATAAATTGCT 


AGAGGCATAT 


ACGTCTCTGT 


TTCATTCGTT 


2340 


20 


GCGTAACCAA ACATTAAACC 


TTGGTCACCT 


GCACCTGTTG 


CTTCAATTTC 


TTCTTCGCTA 


2400 




TCTTTATCAC 


GAT ACTCTAA 


TGCTTTATCC 


ACGCCTTGTG 


CAATGTCAGG 


TGATTGTTCA 


2460 




TCAATCGCAG 


TTAAAATTGC 


CATTGTTTCA 


TAATCATAAC 


CATATTTTGC 


TCTTGTGTAT 


2520 


25 


CCAATTTCTT 


TAATTGTTTC 


TCTAACAACT 


TTCJGGAATAT 


CAACATATGT 


TGTTGTAGAA 


2580 




ATTTCGCCGG 


CGATCAATGC 


CATAC CTGTT 


GTAACAGTTG 


TTtCACAAGC 


TACACGTGCA 


2640 




TTTGGATCGT 


CTTTTAAAAT 


AGCATCTAAT 


ATTGCATCTG 


ACACTTGGTC 


AGCGATTTTA 


2700 


30 


TCTGGGTGTC 


CTTCTGTAAC 


AGACTCTGAA GTAAATAATC GTTTGTTATT TAACATAGTT 


2760 




TGCTCCTTTA 


AATTTATATT 


ACGAAAATTC 


TCTGTCTGTG 


AGCTAAATAA 


AAAAGACCTT 


2820 


05 


CTAACTATTA 


ATATAGAGAG 


AAGGCCTAAT 


ACGTCCATTC 


GCTCTTATCG 


TTCAGACCTA 


2880 


.TTTGTCTGCA 


AAcGGTTTGG 


CACCTTTCTT 


TTATAAAAAA 


GAGGTTGCTG 


GGTTTCATTG 


2940 




GGTCCATGTC 


CCTCCACCAC 


TCAGGATAAG 


AG AAT CCGTT 


AAAAATAATA 


GTACCTAATT 


3000 


40 


AATGAATTAA 


... v 
TGTCAATTTT 


TCACAAATAA 


ATTTACAGTA 


AAATATTGTA 


GATTAATTAT 


3060 




GTTAATGTGT 


TATACTAATT 


AAATGTAAAG 


GCTTACATTT 


AAATTATCGC 


TTTGGAGGGA 


3120 




TTTAGGATGT 


CAGTAGACAC 


ATACACTGAA 


ACAACTAAAA 


TTGACAAATT 


ACTGAAAAAA 


3180 


45 


CCAACGTCAC 


ATTTTCAACT 


TTCGACGACA 


CAACTTTATA 


ATAAAATCTT 


AGACAATAAC 


3240 




GAAGGGGTAT 


TAACAGAACT 


TGGTGCTGTT 


AATGCAAGTA 


CTGGAAAATA 


TACTGGTCGT 


3300 




TCGCCTAAAG 


ACAAATTTTT 


TGTCTCTGAA 


CCTTCATATA 


GAGATAACAT 


TGATTGGGGA 


3360 


50 


GAAATTAATC 


AACCTATCGA 


TGAAGAAACT 


TTCTTGAAGT 


TATACCATAA 


AGTACTAGAC 


3420 




TATTTAGATA AAAAAGATGA ACTATACGTA TTTAAAgGcT ACGCTGGTAG 


CGATAAAGAT 


3480 
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ATGTTTATTA GACCTGAATC AAAAGAAGAA GCTACAAAGA 


TTAAACCTAA 


CTTCACTATC 


3600 




GTTTCTGCAC 


CACATTTTAA AGCAGATCCA GAAGTTGATG GTACTAAATC TGAAACCTTT 


3660 


5 


GTCATTATTT 


CATTTAAACA 


CAAAGTCATT TTAATCGGCG 


GTACTGAATA 


CGCTGGTGAA 


3720 




ATGAAAAAAG 


GTATCTTCTC 


TGTAATGAAT TATCTCTTAC 


CGATGCAAGA 


TATTATGAGC 


3780 


10 


ATGCATTGCT 


CAGCAAACGT 


TGGTGAAAAA GGCGATGTTG 


CATT ATT C TT 


TGGTCTATCT 


3840 


GGCACTGGTA AAACAACCTT ATCGGCTGAC CCACACCGTA AACTAATCGG TGATGATGAA 


3900 




CACGGCTGGA ATAAAAACGG 


GGTCTTTAAT ATCGAAGGTG 


GCTGCTATGC 


AAAAGCAATT 


3960 


15 


AATCTTTCCA AAGAAAAAGA ACCACAGATT TTTGACGCAA TCAAATATGG 


TGCAATTTTA 


4020 


GAGAACACTG 


TAGTTGCAGA 


AGATGGTTCA GTGGACTTTG 


AAGACAATCG 


TTATACAGAA 


4080 




AACACGCGTG 


CCGCTTATCC 


AATTAATCAC ATTGACAATA 


TTGTAGTACC ATCTAAAGCA 


4140 


20 


GCACATCCAA 


ATACAATTAT 


TTTCTTAACT GCGGATGCAT 


TTGGTGTTAT 


TCCACCGATT < 


4200 




TCAAAGTTAA 


ATAAAGACCA 


AGCAATGTAT CATTTCTTGA 


GTGGTTTCAC 


TTCTAAATTA 


4260 




GCTGGTACAa 


GCGTGGTGTG 


ACAGAACCTG AACCATCATT 


CTCAACATGT 


TTCGGAGCAC 


4320 


25 


CGTTCTTCCC 


GTTACACCCT 


ACTGTTTACG CTGATCTATT 


AGGTGAACTT 


ATCGATTTAC 


4380 




ATGATGTTGA 


TGTTTATCTT 


GTTAATACTG GATGGACTGG 


CGGAAAATAT 


GGTGTAGGAC 


4440 




GTAGAATCAG 


CTTACATTAC 


ACACGTCAAA TGGTAAACCA AGCGATTTCT 


GGCAAATTGA 


4500 


30 


AAAATGCAGA 


ATATACAAAA 


GATAGTACGT TTGGTTTAAG CATTCCTGTA GAAATTGAAG 


4560 




ATGTACCGAA 


AACAATTTTA 


AATCCAATTA ATGCTTGGAG 


CGACAAAGAG 


AAATATAAAG 


4620 


35 


CACAAGCAGA 


AGATTTAATT 


CAACGTTTTG AAAAG AACTT 


CGAAAAATTT 


GGTGAAAAAG 


4680 


TTGAACATAT 


TGCTGAAAAA 


GGTAGCTTCA ACAAATAAAT 


TTGAATACTA 


AATCaAAACC 


4740 




ACCdGTGTGA ACGGGTGGTT 


TGTTCTGCGG CTATAAGCCT 


TCCTTACTGG 


CCAGCCCTAA 


4800 


40 


AAGGGCACTG 


ACAAGTCAGC 


CAACTGCACT ACTATTCCAG 


CAACC CTAAA 


GGGTTACTCT 


4860 




TTTTTCTTTC 


TTTTTTTATT 


TTTCTCTCCA GTGAAAGGAT 


CTAAATATTC 


TTCCATTGAG 


4 920 




ATTTGGTCTG 


CAACGATATC 


CTCTTGTAAT TGATTACGAA 


TATAATTTTC 


AATCACTTTT 


4980 


45 


TTATTTCTAC 


CTACTGTATC 


CACATAAAAT CCTTTACACC 


AAAACTTTCT 


ATTTCCATAT 


3 U ** \J 




CTATACTTTA 


AGTTAGCATG 


TCTATCAAAT ATCATTAAAC 


TACi-rriTcc 


TTTTAAATAG 


5100 




CCAACAAATG 


ATGATACCCC 


AAGTTTGGGT GGTATACTAA 


CTAACATATG 


GATATGATCT 


5160 


50 


TTACATGCCT 


CTGCTTCAAT 


TATCTCTACA CCTTTTCTTT 


CACATAATTG 


ACGCAATATA 


5220 




ATCCCTATAT 


CTTTTTTTAT 


TTTTCCATAT ATCACTTGTC 


TTCTGTATTT 


AGGTGCAAAG 


5280 
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AAATAGCATC TCCTCGTGTT GATTATTTTG GTTGGCTGAC CAATATTTAT TCTAGCACGT 54 00 

AGAGATGCAT TTTTTGTGAC AATGGTAGAA CCTTTTCtGa ACCATACGCA TAGCGTATGG 5460 

TTTTCTTTTT ACAATTAAAG AGCCAACCGT TGTTATAGTC TAACAATGGT TGGCTCCTGT 5520 

TATTTTATGT GCTAAAAATT TATAGGCAAT TTTATTACAA CAATGTACAT TTAAGGTGAC 5580 

CTTCATGCCA AAATCGCATC ACTCATTTAA TGGAAGCAGC ACGTCTTCAT ATAAAGTACC 5640 

GATCCCTAAT TCAACGGATG TAGTACCACA TCTTCAAAGC TTGATAGTTC CCATGCGCAC 5700 

ACCACGTTTC ATACTAGCTA TGCGACTCAA CTTGGTTCAT AAACTCTTTA ATATAAGTCA 5760 

ATGTTTCAAC CATCG CTGGT GGTCTTGGCA CATGTCCTTC TGCCATTTGA TAAAATGTTT 5820 

CATGCGTGGC ACCTTTTAAC TCTAGTTGGT CCGCTAAATA ATACGCATGA TGAATACCAA 5880 

CTTGCTGGTC TTTCCCTCCA TGTACAATTA ATATTGGCGG ACTGTTTTCA TTAATGTTTG 594 0 

20 GAATCGCTTG GCGTGCCTCA TATGCCGCTC GATCTTTTTT CGGATGACCA ATCATTCTTC 6000 

GTAGCATGCC TCTTAAATCG ACACGTTCTT CATACATTAA ATCAATATCT GAGACACCAC 6060 

CCCAGATTGT ATAACTTGTT ACTGGTAAGT CTTGAAATGT CAACAATCCT TGTAAACCAC 6120 

25 CTCGCGAAAA AGCAACCATG TGGATAAATG CATGTGGATA TTTATCATGT AGGAACCTTA 6180 

ATAATTGCGT CACATCATTT AAATCGCCAC GGTAAAATTC GTCTTTG CCT TCACTCCCAT 6240 

TGTTACCTCG GTAGTATGGC CCAATCACTA AAGTTTGACT ATCTGAAAAT TGCATTAATC 63 00 

TACCTGCGCG CACACGTCCT ACTTGACCTT TGCCACCTCG CAAATAAACT ACAATGCGAT 63 60 

TTACTTCATG ATGTGGTGTC ATCATTAAAG CTTTTACTTG TAAGTCATCT GACAAATATG 6420 

TAATTTCTTC GAATTGATGC GTAAAATATT CAATTGGCAT TCGTTTACGT TTGATAAAAG 64 80 

CCAAGTGATT GCACCCTCTC TACGCATTTT AAAATGGTAC TATCTTGCAG TAAGAAACTC 6540 

CGTTGTGCGA GTTCAATATC ATTGATACAG TTAAACAACA CTGGCCCTGC TGTTTCTAAA 6600 

TAATCGTTCT TGCTTACCAA TGATTCAACT TCGATAAAAT ATACATCTTT TACAAAATCA 666 0 

40 

GTTTOATCAT GTGTTTCAAT GGTATATTGT GCTATGTAAT AAATATTTTT AACTTTGGCG 6720 

CCTGTTTCTT CATATAATTC aCGTGTAACT GCTTCAGCAC TACTTTCCCC GCGTTCCCTT 6780 

45 TTACCACCAG GAAATTCAAT CCCCCGTAAA TTATGTTTGG TAAAAAGCAA TTGATTTTTA 684 0 

AACGTTGGAA TAGCTAGCAC ATGATTGCCA TCTGCTATCT CATTATCCTT TTTAAATGTC 6 900 

AAATTAACTT GACGATTATC TTTATCCCTA AACTTCACGC GCATCACATC CCTACATTGT 6960 

SO 

ATGTTAATAT AATAGTTAAT TACTATCGTT GGAGGCATTA ATTATGAAAA AGATATTCTT 7020 

GGCGATGATT CATTTTTATC AAC GTTTCAT TTCGCCACTC ACTCCACCAA CTTGTCGTTT 7080 

55 ■ 
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10 



is 



20 



25 



30 



40 



CCTTTATTTA GGTATCCGTC GTATTTTAAA ATGTCATCCG CTTCATAAAG GCGGCTTTGA 
CCCTGTTCCG TTAAAAAAAG ACAAGTCAGC AAGCAAGCAT TCACATAAAC ATAACCATTA 
. ATATGGTTGT AATTGAGTTA TATCCACTAA AGGGGGGCGA AATTCGAGTC GCCCCTCTTT 
TAATATGCCT GAATGCGCCA CCACATCTTG TTCAAAATAA TAACCTGCTG GTGTAACATC 
TCCTGGATAA TCACCTTTAC GAGCAAGCAT CGCTGTAAAA TAGCGGCTTA AACCATATTC 
GTACATGCCG CCAATAACCA CTTTTGCACC ATGACTTTTC AAAGTATCAA TTGCCGTTTG 
CACTTTATCA ATGCCACCTA GACGAAATGG TTTTAATACA ACAACTTTCA. CATTGTATAA 
TTCTATCAAA TTAATTATGT CCaACAACGA TGTTGCCTTT . TCATCAAGGG CTATTGGAGG 
TATTGTTCCA TCCGCTACTT CATCAAGCAT GGAGATATCT TTAAATGGCT CTTCGATATA 
AAGAACCTGT TCACGCGCTA ATAACTGTAA CTGTGTGAAA TCTTGACGAT CCAAGGACTC, 
ATTTGCATCT ATAACCAATT GAAAGTGAAA GTCTAATTCC CGTAACACTC TAATTTGATG 
CATGATTTGA GGCGTCCATT TTAATTTAAT TCTGGTCGGC TTTGTTGCTT TTAATGACTC 
TAGTTGTTTA TTTGATAAGC CGCTCGcTGT CGCTCCATAT GCTACTGAAA ATGAAGGCAG . 
TACATGAAAC ATTTGATACA ATGCCATGAC AATAGTTGCC CTTGCAGCAG GCGTATTTTC 
CAATGAATCT ACTAATTTTA GTGCTGCTTC ATACGTTTCA AATGATTTAT TTCTATTATC 
TTCGAACCAT TGCTCAATTA CATGTTTCAC TGAGGCAATT GTTTCATGAT CATACCAATC 
TGTTTGAAAA GCGTTACATT CCCCGAAATA TGCATTTCCT TTGTCATCAA TCAATTGGAT 
AAACAAACAA TCACGATGCG TTAAAGTGAC TTTCGGTGTT ACAATTTGTG ACTTAAATGG 
CTCACTATAT TTATAAAAAT GCAAAGCTGT CAACTTCATC AAATCATCCT CTATACAACT 
TATTTCTTTG TAATTTACCT GTTGATGTAT AAGGTAAAGT ATCAACCTTT TCAAAGTGTT 
TCGCTACTTT ATATTTCGCT AAATGTTGTG ATAAATATGC AATCAATTGT GCCTTTGAAA 
TGTCACTTTC ACTGACAAAA TATAATTTAG GCACTTGGCC CCAAGTATCA TCAGGATGCC 
GTACACATAC TGCGTCACTG ATACCTGGAA ATTGctTCGC TACCGTTTCA ATTTGATATG 
GATAAATATT TTCACCGCCA CTAATAATTA AATCTTTACG TCGGTCATAA ATCATGACAT 
AACCTTCATG ATCTATTTCA GCAATGTCAC CCGTATTAAA ATAACCATTT TCAAACGTAC 
CCGTTAAATC TGTTGGATAC AAATATACAT TCATCACATT GGCGCCTTTA ATCATTAATT . 
CTCCATGACC TTCTTTATTA GGATTTTTAA TTTTTACGTC AACATTGGCA CTTGGCATCC 
CTACAGTGTC AGGACGTGCA TGCAACATTT CCGGTGTTGC TGTTAAAAAT TGCGAACATG 
TCTCAGTCAT ACCAAATGAA TTATAAATTG GCAGGTTATA TTGTAATGCC GTCTCTATCA 



7200 
7260 
7320 
7380 
. 7440 
. 7500 
7560 
7620 
7680 
7740 
7800 
7860 
7920 
7980 
8040 
8100 
8160 
8220 
*, 8280 
8340 
8400 
8460 
8520 
8580 
8640 
8700 
8760 
8820 
8880 
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AACCTTGTTG 


CATAAGCCAA 


TTTAAAGTTT 


GTGGCACAAG 


CGAAATGTGC 


GTGATTCGTT 


9000 






CATTTTTAAT 


CATCGTTAAA 


ATTTGTTCGG 


CATTGAATTT 


ATCAACAATG 


CGCACAGTAA 


9060 




5 


AACCTTCAAT 


AACAGCTCTT 


AAAAGTACAC 


TGAGAGCCGA 


AATATGATAA 


ATCGGCAAGA 


9120 






CAGATAGCCA 


ATTAGTGTCA 


CGATCAAATC 


CCAAGCTCTC 


TTTACATCCG 


ATTGCACTGG 


9180 




10 


CATAATGATT 


ACGAAACGTT 


TGTGGCACCG 


CTTTtTGAGG 


GCCCGTTGTC 


CCTGATGTAA 


9240 




ACATAATCGA 


TGCAATGTCA 


TCTAAATTAA 


ATGATGTATT 


TAATATGTTG 


GACGGCGACT 


9300 






CTTTCGGCAC 


CACAGTTTCA 


TTCGATGTTT 


CATATTGGAT 


ACCCATTGTG 


TTGTCCAAGA 


9360 




15 


AACTGTTCGT 


TGTAATATCC 


CTTCCAGCGA 


ATTCAATATC 


ATCCAGCGAT 


ACAATTTGAA 


9420 






ACCCTCGTAA 


TTCCAGTGGC 


AAGGTACAAA 


AAATCAATTG 


TACATCGATT 


GACTTCATCT 


9480 






GATTCGTCAT 


CTCATTAGGT 


GTCAACCTTG 


TATTAATCAT 


CGGAATTTCA 


ATATTTGCCA 


9540 




20 


ACCAACATGC 


ATGTATTAAA 


ATGATCGATT 


GAATCGAATT 


ATCTATGTAT 


AGCCCAACAC 


9600 






GAGATTGTTG 


ATAAG C CTTG 


AGTCTTTTAG 


CCAATAGACT 


CGCTTCACAG 


TATAAATTTT 


9660 






GATAAGTATA 


nu^&T r rr* f r , TY5A 


C CGTCTGTTA 


TCGCAATATG 


ATGTCCATTT 


TGTTGTGCTT 


9720 




25 


flTTTAT'ATAA 


C CAAAAGTC C 


ATGCGTTATT 


CCTCCAAAAT 


CATTTACATT 


ATAATTATAA 


9780 






PCATTTTATG 

\*Wf* ill* * » X 


ACATTCTAGC 


AGTGGTTATG 


TTTAAAAATA 


TAAAAAAGTA 


GACGAATTGA 


9840 




: 


TGCATT7GATA 


TGATTGTTAT 


AATGCTCAAT 


ACATATCGTT 


ATATCATTCG 


TCTACTATTA 


9900 




30 


TCAGTTATTT 


TTATTTAATT 


TTAGTGTCAT 


TCTGTCATTT 


TGATGTGGTG 


ATTTACCGAT 


9960 






TGTTGCCACA 


TCATCTGCAA 


TGTCAATTGG 


TATACGGTTC 


ATGTCTTGTA 


ATGCACTTAA 


10020 




35 


ATGGAATACT 


TCATCATCTA 


AATTTTCAAT 


GAGATATACA 


TAATATGTTA 


C CTTGTC CTT 


i n n o r> 






TTTATATTTT 


AACGTTTTCC 


AAAAGTCCGG 


CTTGCAATTC 


AATAGATTAT 


CCGGAATATA 


10140 






TTCAATAAAT 


AAGTAACGTT 


TGCTGCCTAC 


TTTGTCTATG 


AAATATTTTG 


CAGTGCCTTT 


10200 




40 


TTCTATACCT 


CTTATATGTG 


CATAGTCTGC 


TGAAAAGTAA 


ATACTACCTA 


TTGTTTCATT 


10260 






ATGTTGTTGT 


ATTTCAAATC 


GTTGGCCTAC 


TATTTTATTA 


TTTGTGCTAC 


nGGGGACTTA 


10320 





(2) INFORMATION FOR SEQ ID NO: 144: 

45 <i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1477 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

so 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 144: 
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GTGTGGATTG GATTTTAAAA TCACCCTCAT AAATACTGTC ATCAATATGA TAAGTTACAA 120 

TTTCACCTAT TATTAAATCA GCGCCATCTA ATACATCTCC AAGCAATATC ATTTGCGmTA 180 

GTTTACATTC GAATCTCATT TTCGCATCTT TAATTCCTGG ' CGTCTTAATC GTTGTAGATG 240 

TTAAAAGTGA TAATTCTGTA CGACTCAACT CACTGTCACC ATATGCT AAC GGCGCTGCAG 300 

TCTCATTAAT ATCTTGAACA TTATCTTCGT CTGTAATATG CACAACAAAG TCTCCAGTCC 3*60 

GTTCTATATT TAATGCAGTA TCTTTTCTCT TACCTCCTGC ACGTTGAACT GCAATAGCAA 420 

TCATTGGCGG ATGATTATTA ACAATATTAA AAAAGCTAAA TGGTGCTGCA TTTACTGATG 480 

CATCTTGATT TAATGTTGTA ACAAAAGCTA TAGGTGGTGG AATAATTGAA CCAATTAATA 540 

ATTTATAGTT TTCTCTAGCA GTTAATGATT GTGCATCAAA CGTATACATA ATACCTACCT 600 

CTTTTCTAAG TATATCTAGG TATTTCTCCG ATTTTGGTTA ATTTAAACAT CTATTCTCCT 660 

20 CTGAAAATCA CTTGTATTTA TTTAGCAAAT CTTTTGAAAT ATGACACATA TGCATATCTT 720 

CTGGATATTT TTCTAAATGT TGCTGATGTT CTTCAGCACT TTTAATGTAG TTAGACAGCG 780 

GTAAGACTTC CACTGCAATT TGATCTCTGT CTTTACGTCG TTCAATGAAC TGACGCGCTT - 840 

CAATTAAGTG GTCATCTACA CAACTATATA AACCCGTTCG ATACTTTTGT CCAATATCAT 900 

TTCCTTGTTG ATTCACACTG TAAGGATCAA TGATTTCAAA TAAATAATTC ATAATGTCTG 960 

TAATTGTTAA CATACGATCA TCGAAATGAA GTTTGACACA TTCAGCATAA CCATCATACG 1020 

GACCGTCTAA^ TTTAGAGCTT CTTC CATTTG CTCTTCCTGC TTCTGTATGT ATAATTCCAG 1080 

GTATTGTTGC AAAAAATGCT TCAACACCCC ATAAACATCC TCCTGCTACA TAAACAACTG 1140 

CCATATTTAC ACCTCATCAT CCTTTTTTAT ATTTTTAACA AGGTTATACG ATTTAATACC - 1200 

GCCATGACAT GATTCTGATA CACCTTCATT ACGATACCCA TATTTTTCAT AAAATGAAAT * 1260 

TAATGATTCT CGACATGTTA ACGTTACACC ATGTCGATGA TGATTCTTAG CAAGAGTTTC 1320 
40 AAAATAGTTT AGTAAGCGAC CTGCAATACC CTGACCTTGA TAATTTGGTG CTACAACAAG * . 1380 

ACCTAACACA CTAATATAGC CACCTTCACT ATTATTTGTG GAGACATTTT TAAATAAATC 1440 

ATCGGTAATG TAACGCTCTT TTATGACTGG ACCGTTG 1477 
45 (2) INFORMATION FOR SEQ ID NO: 145: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3 976 base pairs 

(B) TYPE: nucleic acid 
50 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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AGGTGATTAT CCTAAAAATG CTCATGAGGT CGCTATTAAT GATAAGTTAG CTGCAGACAA ' 60 

CATTAGAGTC GGGGATAGAT TACATTTTAA AAATAATTCA ACTAGTTATA GAGTTTCTGG 120 

5 TATTTTAAAC GACACAATGT ATG CGCATAG TTCCATTGTG CTATTGAACG ATAACGGATT 180 

TAATGCATTG AATAAGGTTA ATACGGCATT TTATCCAGTG AAAAATTTAA CACAACAACA 240 

ACGTGATGAG CTTAATAAAA TAAATGACGT TCAAGTTGTG AGTGAAAAAG ATTTAACAGG 300 

10 

TAATATTGCG AGTTATCAAG CAGAGCAAGC ACCGTTAAAT ATGATGATTG TTAGTTTGTT 360 

TGCTATTACA GCAATCGTTC TAAGTGCATT TTTCTATGTT ATGACGATTC AAAAAATATC 420 

ACAAATTGGC ATTTTGAAAG CAATTGGTAT TAAGACAAGA CATTTATTGA GTG CGTTAGT 460 

15 

TTTACAAATT TTAACACTAA CAATAATTGG GGTAGGTATT GCTGTGATCA TCATAGTAGG 540 

ACTATCATTT ATGATGCCGG TAACGATGCC TTTTTACTTA ACAACGCAAA ATATTTTATT 600 

20 AATGGTGGGG ATATTTATAT TAGTAGCGAT TTTAGGTGCC TCACTATCAT TTATCAAATT 660 

ATTTAAAGTG GATCCTATCG AAGCAATTGG AGGTGCAGAA TAATGGCATT AGTCGTTGAA 720 

GATATCGTCA AAAATTTCGG AGAAGGTTTG TCTGAAACAA AAGTTTTAAA AGGTATTAAT 780 

25 TTTGAAGTGG AACAAGGGGA ATTTGTCATT TTAAATGGTG CCTCTGGTTC TGGGAAAACA 840 

ACATTGCTAA CGATATTAGG CGGATTGTTA AGTCAAACGA GTGGTACAGT GCTTTACAAT 900 

GATGCGCCAT TGTTTGATAA ACAGCATCGT CCTAGTGATT TACGATTGGA AGATATTGGT 960 

30 

TTTATTTTTC AATCTTCACA TTTAGTTCCT TATTTAAAAG TGATAGAGCA ATTGACACTC 1020 

GTAGGTCAAG AAGCGGGAAT GACCAAACAA CAAAGTTCAA CAAGAGCAAT ACAACTTTTG 1080 

AAAAATATTG GTTTAGAAGA TCGCTTGAAT GTATATCCGC ATCAGTTATC TGGCGGTGAA 1140 

35 

AAGCAACGTG TTGCGATTAT GAGAGCATTT ATGAATAATC CGAAAATCAT TTTAGCAGAT 1200 

GAGCCCACAG CAAGTTTAGA TGCCGATAGA GCAACAAAAG TTGTTGAGAT GATACGTCAA 1260 

CAAATTAAAG AACAACAAAT GATTGGTATT ATGATTACAC ACGATCGAAG ATTATTTGAA 1320 

40 

TATGCAGATC GAGTGATTGA ATTAGAAGAT GG CAAAATAA CTGATTAGTG GCTTGTAAAG 1380 

ACGCTAAATG TTAATGATTT AAGACATAGT AGTATAAAAG TTAGATAACA GAATACGATT 1440 

45 TGGGTTTACA AAAAACAGGC TGGGACATTA AGTTCTTAGG CAATGTAAAA AAGCTGATTT 1500 

CTATTAATTA TTTGATAGAA ATCAGCTTTT TTGATATGTA TTTTATAATG TACAGCTCGT 1560 

TGCATTCATA TAGCTTGAAG TCACGTTTAA AACCATATCT ATCATTATGG TATGCATATC 1620 

50 TTTTAAAACC TATTCTTTTG TTATTAGGAC ATATAAATTC ATCATTAAGT TCGTCATATT 1680 

TCCAATTTTG AGTGTTAAAA ATGTCACTTT TAAACTTTCT AGTTTTATCT TTAATAAACA 1740 

55 



752 



EP0 786 519 A2 





CACTATCATA 


ACATGCATCA GCTACAATAT 


ACTCCGGTAA ATAACCGAAG 


nTATTTTgAA 


1860 




TCATTGTTAA AAATGGAATT AAAGTTCTAG 


TATCTGTTGG 


GTTTTGAAAT AGGTCATAGG 


1920 


5 


ATAAAACAAA 


TTGAGAATTT GTCGCTATTT 


GTAAATTGTA 


TCCTGGGTTA 


AGTTGGCCAA 


1980 




AGTGTCTTAT 


TTTTTTAAAG TATTTAAAAG 


TAAAATTACA 


TGTTAATACG 


TAGTATTAAT 


2040 


10 


GGCGAGACTC 


CTGAGGGAGC . AGTGCCAGTC 


GAAGaCAGGG 


GCCCCAACAC 


AGAArcTGAC 


2100 


ATATAGTCAG 


CTTACAACAA TGTGCCGGTT 


GGGGTGGCTG 


AGACGGCACC 


CTAGGAAGGG 


2160 




ACCCGTCATC 


AAAAATTCTA TTTATAGAAT 


TTTACAGTAA 


TGTGCCAGAT 


GGGCATAGCG 


2220 


15 


AAgcCATTCA ATACGAAGTA TTGTATAAAT AGAGAACAGC AGTAAGATAT TTTCTAATTG 


2280 




AAAATTATTT 


TACTGCTGTT TrrTTTAGGG 


ATTAATGTCC 


CAGACTCTTT 


AGTTTATTTA 


2340 




TTTTCAATAT 


AACAATTGTC TAATCAAGGA 


TTAACGAATA 


TTTAAAGATA 


GTTTGACGCA 


2400 


20 


ATATTAGAAA 


CAACCTATAA TAATAGTTTG 


TTTGTGGATT 


AACTATTATA 


AATAAAAGCG 


2460 




GCGTAAAGAC 


ATATAAACCA ACTACTTGAA 


CAATATAACG 


TTAATAACAA 


TCTATACTGA 


2520 




TACATTACGC 


CTAGATAATC TTTGATGAGC 


ACATGTAAGA 


AAAAGTGATA 


TGGTGTATGA 


2580 


25 


-CTTCCGACAC 


CATCGATAGA TAAACCTAAT 


TTTTGGGCTA 


GTCGTAAGGC 


GCGCAATACA 


2640 




TGAAACTGAC 


TTGTtACACA AACAATTTTA 


ACTGCTTCAT 


GATACAAATT 


GTTGATGATT 


2700 




TGTTTAGAAT 


ATAAAAAGTT TGTGTATGTA 


TTTATAGAGT 


GAGATTCCAT 


TAGTATATGT 


2760 


30 


GTTTTATCAA 


CACCATGTGC AATCAAATAA 


CGTTGCATAG 


CTAAAGCTTC 


AGAAATTGGT 


2820 




TCGTGTGGTC 


CTTGTCCGCC AGATACAATG. 


ATCTTTGTTG - 


. CTGATGCTTG 


• TTGTTGATAG ; 


2880 


35 


ATATCAAGTG 


CACGATCTAA ACGCGCTGCA 


AG CATTGGTG TGACAAATTC 


GGTAAAAATA 


* 2940 


CCAGCACCTA 


ACACAATTAT GATATCAACT 


TCTTTGTTGT 


ATGATCTATG 


TCTATATGAT 


3000 




ACTGTCCAAA 


CGAGATAACA AATAAAGGTT 


AGTAACAGGG 


AAAGACATAA 


TATAGCTAAC 


3060 


40 


CACATAGACA 


AACCTTTCAC AATAGGTGAC 


TGAATCGT AG 


TTATAAATAG 


AAGTGCTGAT 


3120 




GTGTAGAGTA 


CAAATTTATA TGAAAAAGAT 


AATAATTTTT 


TAATAAATAA 


GCGACTAGAA 


3180 




GTATGAGAAA 


ATAAATATCT ATGTTTGAAT . 


AGCATGATAA 


TACTGATTAT 


TATAAATGTT 


-3240 


45 


ACAAACATAG 


ACCAAGGGAA AGTATAGGTC 


ATGATGCTAT 


AGATGAGTGA 


CAAAAATATC 


3300 




GATATGACAA 


CTAAGATGTA GCATGTTAAA TTTAACGTGA 


GAGTATAGTT 


GAAAATTAAC 


3360 




GGACAAATAA 


CGATAAGTAT AAATATTAAT 


AATAAATTCA 


ATAACATACT 


GACACCTCGC 


3420 


50, 


TTATAATAAA 


TATTAAATAT AAATGTAGAT 


GATTTAATTT 


ATTAAAGCAA 


GGAGAAAGGA 


3480 




GCAACATGTA 


AATCTTAATT TGTTATATTA 


TATATGGGTC 


AATATTTTTG 


TGTTTTTTAG 


3540 
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TATGGTAAAA CATTTACAAG ACCATATTCA ATTTTTAGAG CAGTTTATAA ATAACGTTAA 3660 

CGCATTAACT GCAAAAATGT TGAAAGATTT ACAAAATGAA TATGAAATTT CATTAGAGCA 3720 

GTCTAACGTA TTAGGTATGT TAAATAAAGA ACCTTTGACA ATTAGTGAAA TCACGCAAAG 3780 

ACAAGGTGTA AATAAGGCCG CAGTAAGCCG ACGAATTAAA AAGTTAATCG ATGCTTAATT 3840 

AGTTAAGTTA GATAAACCAA ATTTAAATAT TGATCAACGT TTGAAATTCA TAACCTTAAC 3900 

TGACAAAGGT AgAGCATATT TGAAAGAACG TAATGCGATT ATGACAGATA TTGCGCAAGA 3960 

TATTACTAAT GATTTA 3976 
(2) INFORMATION FOR SEQ ID NO: 146: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3346 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
<D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 146: 

GCTACCTAGG CATTTAAGAG ATCAAAAAAT GTATGAATAT GAACGTTATT TTTATGAGCA 60 

AGAACTTAAT GGCGTTGATG aAGGGGAAAT TTTAAAGAAG TTAAAAGACC CACAAGATGT 120 

TGCAGCTGAA ACAAAAGCTA GAAGTGTTAT TGATTATGCT GAATCTAAAC CAACATTTGA 180 

AAATATTTCA AG AGCTGTTG CTGCTTCATT AAGTTTAGGC ATTCTATCTA TTTTTGTCAT 240 

CCTTATACCA GTATCTATAG TTGGATTATT TGTATTAGCA TTATTTTTAA TATCACTTTT 300 

GCTGCTGTTT TGTCCAATTA TTTTATTAGC ATCAG CAATA TCCAGAGGAA TTGTGGACTC 360 

. AATTAGTAAT GTATTTTTTG CCATAT CAT A TTCAGGATTA GGATTAGTAT TTATCATTGT 420 

CATATTTAAG ATTTTAGAAT ACATTTATCG TTTAATCTTA AAATATTTAC TTTGGTATAT 480 

TAAAACTGTC AAAGGAAGCG TTAGAAAATG AAGAAATTCT TTTTTATTGG GCTTTTAGTG 540 

TTTGTTGTCT TTTTTACAGC AGCAACCATT ATTTGGTTCA GCTATGATAA AAACAAATAT 600 

GGTACTAAAC AATATGATAA AACATTCAAA gACGATGCTT TTGACAATGT ATCTATAAAT 660 

45 TTGGATAGTA CAGAACTTCG TATAAAACGG GGGAATCAAT TTAGAGTTAA ATATGATGGT 720 

GACAATGATA TATTAATTAA TATAGTAGAT AAGACGTTGA AGATTAGTGA TAAAAGGTCT 780 

AAGACAAGAG GATATGCAAT TGATATGAAT CCTTTTCATG AGAATAAGAA AACGTTAACG 840 

50 ATTGAAATGC CTGATAAAAT GATTAAACGT TTAAATCTAT CATCTGGAGC AGGAAGTGTT 900 

AGAATCAGTG ATGTTGATTT AGAGAACACA AGTATTCAAA GCATTAACGG TGAAGTAGTT 960 
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AGTAAAAGTA ACATTAAAAA TAGCAATATT AAAGTTGTTA TTGGTACGCT ACAAATCGAC 


1080 




AAGAGTCAAA 


TTAAACAATC CATATTTTTA AACGATGATG GTGACATTGA ATTTAAAAAC 


* 1140 


5 


ATGCCATCAA 


AAGTAGATGC AAAAGCTTCT ACTAAACAAG GAGATATTCG TTTTAAGTAT 


1200 




GATAGTAAAC 


CTGAAG ACAC TATACTAAAG CTAAATCCGG GAACGGGTGA TAGCGTAGTT 


1260 


10 


AAAAATAAAA 


CATTTACTAA TGGtAAAGTT GGGAAAAGCG ACAATGTTTT AGAATTTTAT 


1320 


- ACGATTGATG 


GTAATATCAA AGTTGAATAA ATAAAGGATG TAAGCACCGA TATTAGGAAG 


1380 




CATAATTTCT 


CTAATATCGG TGTTATTTAT TTGTTGGCAA AAGTTAAGTC GGTATCTATA 


1440 


15 


TTGCCAGTAA AGTGAGTGAT ATTAAGGTCT TGACCATCTA ACCATGATTT GAAATCTATT 


1500 




ATTTCTGGTG 


GCGCATTTTC TCCCAATGTA AAATATGCAG TTAATGTTTC AGGTTGATAC 


1560 




ATTGATGTAT 


GGATGGTGCC AGACCAGCTT TTGAATAGTT TACTGTAAAT TTCATACTGA 


1620 


SO 


GGATTATTGA 


ATAACTTAAA TGCTGTAGTC ATATCTAAAT TATCATTAGT TTGTGAAATG 


1680 




GTACGCGCCA 


GTCTTTCTTT AGATTCTTTT GTATAATTAC GATTTTCATG TGTTAATATT 






TCAAAATGAT 


TTGTACATAT ATTATCATAA CGAACATCTA TTGATCTCGG TGTCACTTCA 


i a fin 


25 


ACAATTGCAT 


GGTTCAATGA TTTGTCCATC AGTATGTAGC TAAATGAGCT TCTGTGTGGT 






ATTTCTTTCA. 


ATAATTGGAT TGCTTCTGTT ACATTTCGGC AATTTTCAAG . AATTAGACGA 


1 QTA 


30 


CCAATCATAT 


AACATACAAA ACCATTTGCT GGTTTCTTCC GGTGCATAAA GTTATAGCCC 


X 7 O U 


ATAGTTAATC 


CTGACTCATT CATAC CATCC ATTCTTCCAG TTACCCTTGA TACAGGACCA ' 


^ \J *x \J 




ATTTGAGCTA 


AACCGCTATC TGTAGGTTGA TAAAGTAAGT AGCGACCATC ATAAGTTGCA 


2100 


35 


GGGTGGTAAT 


CATAATTTCT AACCATGAAG TCTTTGCCTT GAAAGACCGT GCAaCCACTT 


2160 


TCTTTTAAAT 


CGGTAAAACG ATAATGTCCA AAGTTTAAAA TAATTTGGCG TGTTGGCATT 


2220 




TTGAGTATAC 


TTTGTAGTCC CATTAATTCT TCCCATATTT GAGGTGCGTA TGTTTGGAAT 


2280 


40 


ATTTGATAAG 


TTTCATTTAC ATCTATATCG AAACGTGGGA CaCnTTTTTT CCATTCTTTT 


234 0 




TCTCGATTTT 


TTAGAAGAGG TGTTTGTTGA AGCCATTTAC CAGTTTTAAC ACCTAACTCG ' 


'2400 




AAATGTGAAC 


CTCTAAAAGT CATGATATCT GATGTCACTT GTTGCATATC ATCGGCCCCT 


2460 


45 


TTCTTTTTAG 


TTGTAATATA TTGTAAATAA ATAGTAATCG TATGTATATT GAATGTCATG 


2520 




TTAAATAAAG 


TTATATTTTA CTAAATGAAA TATAAAATTG TTTGAGGTGA TTTGTCGGTG 


2580 




TATAAGACTT 


ATCAATCAGT TAAAACATAT TTTTATAGAT GGTGGGGATA TTGAGTTAAA 


2640 


SO 


AACTTAAAAT 


CATCTTATCA TAAATATCAA TCTTAAGTTA GCATTCACGA TAATAGTCAT 


2700 




TGTTAACATT 


AGCATATAAG GTCATGTCAC GTTGAAACAG AGGTTCCTCG GCATTTTTGA 


2760 
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TTATTTAATG ATTATTCTAT ATATGATAGT ATAATGAAAT GTAGATAGGT ATTTAATTTA 2880 

ACAGAGGTGA AATTGAGATG TGGAATTTTA TTAAATGtGT GkTTAAATTC GTATTTAGCT 2940 

TAGTTGCTAT TACAACATTA GTTGCTGGTG TTGGTGTAGT AGCATTTGCT TATATCTTTA 3000 

AAAAAGATTT TGAAGATATT GAAAGAAAAA CTAAAGAAAT TATTTCTGAT ATTGAAAGTA 3060 

AAAATAACTA ATAACATTTA GAGGCTGGGA CATAAATCCC TAAAAAACAG CAGTAAGATA 3120 

ATTTTCAATT AGAAAATATC TTACTGCTGT TCTCTATTTn ATcAmTACTt CGTATTGAAT 3180 

GGCTTCGCTT TCCTAGGGTG CCGTCTCAGC CTTGGTCTTC GACTGGCACT GCTCCCTCAG 3240 

GAGTCTCGCC ATTAATACTA CGTATTAACA TGTAATTTTA CTTTGGAAAT ACTTTTAAAA 3300 

AATAAGACAC TTTGGCCCAA CTTGGCACAT AAATGTAAAA TTCAAT 3346 
(2) INFORMATION FOR SEQ ID NO: 147: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2375 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 147: 

GTTGAAGAAA GAAATATAAC AGTCAATTAT AATTATAACC TTGTTGAAAT CGACGGTGAC 60 

30 AAAAAAGTGG CTACATTCGA ACATATCAAA GCATACGATA GAAAAACAAT AAGTTATGAT .120 

ATGTTACATG TAACACCACC TATGGGTCCC TTAGATGTAG TAAAAGAAAG TACACTTTCA 180 

GATAGTGAGG GTTGGGTAGA TGTTAACCCA ACCACATTAC AGCATAAAAG CTACTCTAAT 240 

GTATTTGCAC TTGGTGATGC TTCAAATGTA CCTACTTCAA AAACAGGCGC ACTATTcGTA 300 

AGCAftGCACC TATCGTCGCT AATAATTTAT TGCAAGTGAT GAATAATCAA ATGTTAACGC 360 

ATCATTATGA TGGTTATACT TCATGCCCTA TTGTTACTGG ATATAATAGG TTAATACTTG 420 

CAGAGTTTGA TTATAATAAA AATACTAAAG AAACAATGCC GTTTAATCAG GCCAAAGAAC 480 

GTaGAAGTAT GTATATATTT AAGAAAGATT TATTACCTAA AATGTATTGG TAOGGCATGC , 54 0 

TAAAAGGATT AATATAATAA AGTACAGAAA ACAATAAATT TTTAATGAAA AATCTTTTAC 600 

TATAAAAGAT TAAGTATTTA AATGACGTGT CAGTGTTGTG TTTATATGTC GTGAATTTTT 660 

AGCTCTAAAT AGTATAAGAT TGAAAAAGTT GTTACTGTTT TAAATGATCA CGATGAAGTC 720 

50 ATTCAATAAG AATGATTATG AAAATAGAAA CAGCAGTAAG ATATTTTCTA ATTGAAAATC 780 

ATCTCACTGC TGTTTTTTAA AGGTTTATAC CTCATCCTCT AAATTATTTA AAAATAATTA 840 
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AGATATTCAA ACCACGTGTA CTCAAAATGA TAGCTTGGTA TGTACGTCCA ATAGTAATTT 960 

CAATAACTTT GTCTGTTGAA CACTAAGAGC AA TT TTAATT TCATAATGTG TTGTAAACAT 1020 

5 TTTTTTTGAT TGGAGTTTTT TTCTGAGTTA AACGATATCC TGATGTATTT TTAATTTTGC 1080 

ACCATTTCCA AAAGGATAAG TGACATAAGT AAAAAGGCAT CATCGGGAGT TATCCTATCA 1140 

GGAAAACCAA GATAATACCT AAGTAGAAAG TGTTCAATCC GTGTTAAATT GGGAAATATC 1200 

10 

ATC CATAAAC TTTATTACTC ATACTATAAT TCAATTTTAA CGTCTTCGTC CATTTGGGCT 1260 

TCAAATTCAT CGAGTAGTGC TCGTGCTTCT GCAATTGATT GTGTGTTCAT CAATTGATGT 1320 

CGAAGTTCGC TAGCGCCTCT TATGCCACGC ACATAGATTT TAAAGAATCT ACGCAArCTC 1380 

TTGAATTGTC GTATTTCATC TTTyTCATAT TTGTTAAACA ATGATArATG CAATCTCAAy 1440 

ATATCTAATA GTTCyTTGCT TGTGTGTTCG CGTGGTTCTT TTTCAAAAGT GAATGGATTG 1500 

20 TGGAAAATGC CTCTACCAAT CATGATGCCA TCAATACCAT ATTTTTCTGC AAGTTCAAGT 1560 

CCTGTTTTTC TATCGGGAAT ATCATCGTTA ATTGTTAACA ATGTGTTTGG TGCAATTTCG 1620 

TCACGTAAAT TTTTAATAGC TTCGATTAAT TCCCAATGTG CATCTACTTT ACTCATGCGT 1680 

25 TTGATAAAAA CTTAAATAAT ATTAATTCGG TCATCAGTGG CGTTAAATCT TTTATCATTT 1740 

TTAGTTATAG TTGATAAATT TATATTTATA AGCATATATG GATATTTCAT CAAAAATTTT 1800 

TATTTATATA AATCCGAACT G CAT ACATAT TTGTTTAAAT AAGAGGTATT ATTTTTCGGG 1860 

30 

AAATTGCTGT CTGAGTTAAA AGGATTAGTT TTATAAAATG AGTTGAACTA TAGCCAAAAA 1920 

CGATTAAAAT ACTGATAATC CATTTTTG t A TTATGTTAGG GACTTTTTTA CTTAATTTTA 1980 

ACCCTATTGG aGCmAATATA ATACTCCCTA TTATAAGGAA TAAGGCGTCA TATAAaGGGA 2040 

35 

TATAACCTTG AATAAGTTTG ATGACAAAAG CACCAATTGA AGATATAAAA GCAATTACTA * " 2100 

TACfATTAGC GACTACAGTA TTCATTGGTA ATTTGAATAA AACCAATAAT ATAGGAATAA 2160 

40 TAATGAAGGC ACCACCTGCA CCTACTATAC CTGAAATAAT ACCAATGAAA AGGCCAATGA 2220 

TAACTAATAA ATATTTATTA AATGAAGACT TTTCGGAACT AGGTTtCACT TTAATAAACA 2280 

TTAATGTTAA TGCAAGTAAA GCAATAATGA TATATACCGT ATTTACAAAT GTAGCATCAA 2340 

4S ATAAATTTGC TAGAAATGCA CCTAACATAC TCCCT 2375 

(2) INFORMATION FOR SEQ ID NO: 14 8: 

(i) SEQUENCE CHARACTERISTICS: 
SQ (A) LENGTH: 6115 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS: double 
<D) TOPOLOGY: linear' 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 148: 
GAGGTTTCTA GACAAGCTTT TAATAACTTA CCAAACTCAT TAAgrTGGTT gTGtTGGACT 60 
GCCtATTATC mAAGtATTAT GaGTTGTTTA ATATTAGtGC TAArACATAC GAAGAGTGGT 120 
TTAAACAATT TAGTAGTAAG AAAGCACAAT TCAGTATTAA TCTCACGGAT AAATGGATAA 180 
TTCAAATCGC ATATGGTAAA TTAATAATAA TGGCTAAAAA TAATGGCGAT ACATATTTTA 240 
GAGTTCAAAC AATTAAAAAG CCAGGTAATT ATATTTTTAA CAAATATCGA TTAGAGATAC 300 
ATTCTAATTT ACCAAAATGT TTATTTCCGC TTACAGTGAG AACACGACAA AGTGGCGATA 3 60 

CATTTAAACT GAATGGGCGC GATGGTTATA AGAAAGTGAA TCGCCTGTTT ATAGATTGTA 420 
AAGTGCCACA GTGGGTTCGG GATCAAATGC CAATCGTATT GGATAAACAA CAGCGCATTA 4 80 

TTGCGGTAGG AGATTTATAT CAACAACAAA CAATAAAAAA ATGGATTATA ATTAGTAAAA 540 
20 ATGGAGATGA ATAGCGTTAT GCATAATGAT TTGAAAGAAG TATTGTTAAC TGAAGAAGAT 600 

ATTCAAAATA TCTGTAAGGA ATTGGGAGCA CAATTAACAA AGGATTATCA AGGTAAACCA 660 
TTAGTATGCG TGGGTATCTT AAAAGGCTCA GCAATGTTTA TGTCAGATTT AATTAAACGA 720 
25 ATTGATACCC ATTTATCAAT TGATTTCATG GATGTTTCTA GTTATCACGG AGGCACTGAG 780 

TCAACTGGTG AAGTTCAAAT CATTAAAGAT TTAGGTTCTT CTATTGAAAA TAAAGACGTA 64 0 

TTAATTATTG AAGATATCTT AGAGACTGGf ACTACACTTA AGTCAATTAC TGAATTATTA 900 

30 

CAATCTAGAA AAGTTAATTC ATTAGAAATA GTTACTTTAT TAGATAAACC AAACCGTCGT 960 

AAAGCGGACA TTGAAGCTAA GTATGTAGGT AAAAAAATAC CAGATGaATT TGTTGTTGGt 1020 

TACGGTTTAG ATTATCGTGA ATTATACCGA AACTTACCAT ATATCGGTAC GTTAAAACCT 1080 

GAAGTGTATT CAAATTAATT TTTTAATCAA TTTCAGTTAT TATTACTATG CGTTTGAGAA 114 0 

ATAATAGTGT AGACTCAAAA ATATGAAAAA TGTATTTCAT ATATATTTAA TTTTAGACAA 1200 

GACATATGTC TTGAAAAGTT GAAAAATATA GAGATTGATA AAACTAATAC GGGTGTGAAT 1260 

GACATTGATG TTAAGCTCAA TTACTAGCTT ATAAAACATG TCATATGTTA CAATTTTTGT 1320 

TAGTTTTATT ATGGGAAGTA GGAGGAAATG ACGCATGCAG AAAGCTTTTC GCAATGTGCT 1380 

AGTTATCGTA ATAATAGGCG TTATTATTTT TGGTCTATTT TCATATTTAA ACGGTAATGG 1440 

AAATATG CCG AAACAGCTTA CATATAATCA ATTTACTGAG AAGTTGGAAA AAGGTGACCT 1500 

TAAAACTTTA GAAATCCAAC CACAACAAAA TGTCTATATG GTAAGTGGTA AAACGAAAAA 1560 

TGATGAAGAC TATTCATCAA CTATTTTATA TAACAACGAA AAAGAATTAC AAAAAATTAC 1620 

TGATGCTGCT AAAAAGCAAA ACGGTGTAAA ATTAACGATT AAAGAAGAAG AAAAACAAAG 1680 
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10 



1S 



20 



25 
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TTTCTTCCTA AGCCAAGCAC AAGGTGGCGG TAGTGGCGGT CGTATGATGA ACTTTGGTAA a800 

ATCTAAAGCA AAAATGTACG ATAATAATAA ACGTCGTGTT CGTTTCTCTG ATGTAGCAGG ; 1860 

GGCAGATGAA GAAAAACAAG AATTAATTGA AATTGTTGAT TTCTTGAAAG ATAATAAAAA 1920 

ATTCAAAGAA ATGGGATCTA GGATTCCTAA AGGTGTCTTA CTTGTTGGAC CTCCAGGTAC 1980 

TGGTAAAACA TTACTTGCTA GAGCGGTTGC AGGTGAAGCT GGCGCACCAT TCTTCTCTAT 204 0 

TAGTGGTTCA GACTTTGTAG AGATGTTTGT TGGTGTTGGT GCGAGCCGTG TTCGTGACTT 2100 

ATTCGATAAT GCTAAGAAAA ACGCGCCTTG TATCATCTTT ATCGATGAGA TTGATGCTGT 2160 

TGGTCGTCAA CGTGGTGCAG GTGTTGGTGG CGGTCATGAT GAACGTGAAC AAACCCTAAA 2220 

CCAATTATTA GTTGAAATGG ATGGTTTCGG TGAAAATGAA GGTATCATTA TGATAGCTGC ,2280 

TACAAACCGT CCTGATATCC TTGACCCAGC CTTATTACGT CCAGGTCGTT TTGATAGACA 2340 

AATTCAAGTT GGTCGTCCAG ATGTGAAAGG CCGTGAAGCA ATTCTTCATG TTCATGCTAA 24 00 

AAACAAACCA CTTGATGAAA CGGTTGATTT AAAAGCAATT TCACAACGTA CACCTGGTTT 2460 

CTCAGGTGCT GATTTAGAGA ACTTATTAAA TGAAGCATCT TTAATTGCTG TACGTGAAGG 2520 

TAAAAAGAAA ATTGACATGA GAGATATCGA AGAGGCAACG GATAGAGTTA TAGCCGGACC 2580 

TGCTAAGAAA TCTCGAGTTA TTTCTAAGAA AGAACGTAAT ATTGTTGCTC ATCACGAAGC 2640 

TGGTCATACA ATTATCGGTA TGGTACTTGA TGAGGCAGAA GTAGTGCATA AAGTTACTAT 2700 . 

TGTTCCACGT GGACAAG CAG GTGGTTATGC AATGATGCTA CCTAAACAAG ATCGTTTCTT . 2760 

AATGACTGAA CAAGAGTTAT TAGATAAAAT CTGTGGTTTA CTTGGTGGAC G TG TAT CAG A 2820 

AGATATTAAC TTTAAGGAAG TATCAACAGG TGCTTCAAAT\GACTTCGAAC GTGCAACACA 2880 

AATCGCACGC TCAATGGTTA CGCAATATGG TATGAGTAAA I AAATTAGGAC : CATTAGAGTT ; 2940 

CGGTCAT AG C AATGGTCAAG TATTCTTAGG TAAAGATATG CAAGGTGAGC CTAATTATTC 3000 

AAGCCAAATC GCATATGAAA TTGATAAAGA AGTTCAACGA ATCGTTAAAG AACAATACGA 3060 

ACGTTGTAAA CAAATTTTAT TAGAGCACAA AGAACAATTA ATTTTAATTG CTGAAACATT 312 0 

ATTAACAGAA GAAACATTAG TTGCTGAACA AATTCAATCA TTATTCTACG AAGGTAAATT 3180 

ACCTGAAATT GATTATGATG CAGCTAAAGT TGTTAAAGAT GAAGATTCTG AATTTAATGA 3240 

TGGTAAATTC GGTAAATCTT ATGAAGAGAT TCGTAAAGAG CAATTAGAAG ATGGACAACG 3300 

TGACGAAAGT GAAGATCGTA AAGAAGAAAA AGATATTGCT GAGGATAAAA AAGAAGCTGA .3360 

TAAATCTGAT GAAAAAGATG AACCAGCACA TCGACAAGCC CCAAATATCG AAAAACCTTA 3420 

CGATCCAAAT CACCCAGACA ATAAATAATC GATTATATTC AGTACCTCTT TCTATGATAA 34 80 
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AATTGTTATA 


GCAGAAAATA 


ATTGTAAAAC 


AAGTTACTTC 


ATTATTTAGA 


ATGATGGGTG 


3600 




TAGAATAAGT 


ACAATTGTTG 


CATTTTATGA 


AGTAAAGTAA 


TTTTTTAAAT 


ATAGAGTAAT 


3660 


s 


AGAGGAGATT 


GAAATAATGA 


CACACGATTA 


TATTGTTAAA 


GCATTAGCAT 


TTGATGGAGA 


3720 




GATTAGGGCT 


TATGCTGCTT 


TGACAACTGA 


AACTGTTCAA 


GAAGCACAAA 


CGAGACATTA 


3780 




TACATGGCCG 


ACAGCATCTG 


CTGCAATGGG 


AAGAACAATG 


caCAGCAACA 


GCTATGATGG 


3840 


10 


GCGCAATGTT 


GAAAGGTGAT 


CAAAAATTAA 


CTGTGACTGT 


AGATGGCCAA 


GGACCTATTG 


3900 




GACGAATTAT 


TGCCGATGCA 


AATGCTAAAG 


GCGAGGTGCG 


TGCTTATGTA 


GACCATCCAC 


3960 


IS 


AAACTCATTT 


TCCATTAAAT 


GAGCAAGGTA 


AACTTGATGT 


AAGACGAGCG 


GTAGGGACAA 


4020 


ATGGATCTAT 


TATGGTTGTT 


AAAGACGTTG 


GAATGAAAGA 


CTATTTCtCT 


GGAGCAAGTC 


4080 




CaATTGTTTC 


AGGAGAACTT 


GGTGAAGATT 


TTACTTATTA 


TTATGCTACA 


AGTGAACAAA 


4140 


20 


CACCTTCATC 


GGTAGGTCTT GGTGTATTGG 


TAAATCCTGA 


TAATACGATT 


AAAGCAGCAG 


4200 




GAGGATTTAT 


CATTCAAGTT 


ATGCCAGGTG 


CCAAAGATGA 


AACAATTTCA 


AAATTAGAAA 


4260 




AAGCAATTAG 


TGAAATGACA 


CCAGTTTCTA 


AATTAATTGA 


ACAAGGATTA 


ACGCCAGAAG 


4320 


25 


GATTACTAAA 


CGAAATCTTA 


GGTGAAGACC 


ATGTGCAAAT 


TTTAGAGAAA 


ATGCCTGTTC 


4380 




AATTTGAATG 


TAATTGTAGT 


CATGAGAAAT 


TTTTAAATGC 


TATTAAAGGA 


TTGGGOGAGG 


4440 




CTGAGATTCA 


AAATATGATT 


AAAGAAGATC 


ATGGTGCTGA 


AGCAGTATGT 


CATTTCTGTG 


4500 


30 


GAAATAAATA 


TAAATATACT 


GAAGAAGAAT 


TAAACGTGTT 


GCTAGAAAGT 


TTAGGGTAAT 


4560 




TTAATTTAAA 


TCAATACGCT 


AAAATGTTTA 


TTTTTAGCGG 


TTTAGTGAAA 


TGTAGAACTA 


4620 


35 


AATAGTTGTA 


TAATCCTTAG 


TGATTTTGTT 


TGCTTTCTAG 


AATTTATTTG 


ATAAAATAAT 


4680 


TCTATATCCG 


ATAAATAAAC 


TAAGATTTCA 


ACAACTAACT 


AAAAAGGAGT 


GTTCTTAATG 


4740 




GCAGAAAAAC 


CAGTAGATAA 


TATTACTCAA 


ATTATTGG CG 


GTACACCGGT 


AGTCAAATTG 


4800 


40 


AGAAATGTAG 


TAGATGACAA 


TGCAGCAGAT 


GTTTATGTAA 


AATTGGAATA 


TCAAAATCCA 


4860 




GGTGGTTCTG 


TAAAGGATAG 


AATTGCTTTA 


GCAATGATTG 


AAAAAGCAGA 


GCGAGAAGGC 


4920 




AAAATTAAAC 


CTGGCGATAC 


AATTGTAGAA 


CCAACAAGTG 


GTAATACAGG 


TATCGGTTTA 


4980 


45 


GCATTTGTAT 


GTGCTGCTAA 


AGGATATAAA 


GCAGTATTTA 


CTATGC CCGA 


AACAATGAG C 


5040 




CAAGAGCGTC 


GTAATTTATT 


AAAAGCATAC 


GGTGCGGAAT 


TAGTTTTAAC 


GCCTGGATCA 


5100 




GAAGCGATGA 


AAGGTGCAAt 


TAAAAAAGCT 


AAAGAATTGA AAGAAGAACA 


TGGTTACTTC 


5160 


50 


GAGCCACAAC 


AATTTGAAAA 


CCCTGCGAAC 


CCTGAAGTTC 


ATGAGTTAAC 


TACAGGTCCT 


5220 




GAGTTATTAC 


AACAATTTGA 


AGGGAAAACT 


ATCGATGCGT 


TCCTAGCTGG 


TGTTGGTACT 


5280 
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GTTGCTATAG AGCCTGAGGC TTCTCCAGTA TTGAGCGGT6 GTGAGCGAGG TCGACATAAA 5400 

TTACAAGGTT TAGGTGCTGG ATTTATTCCA GGCACTTTGA ATACAGAAAT CTATGACAGT 5460 

ATTATTAAAG TAGGAAATGA TAGAGCGATG GAAATGTCTC GTCGAGTTGC TAAAGAGGAA , 5520 

GGTATTTTAG CAGGTATTTC ATCAGGTGCT -GCGATTTATG CTGCCATTCA AAAAGCAAAA 5580 

GAATTAGGAA AAGGTAAAAC AGTAGTAACA GTATTGCCGA GTAATGGTGA ACGCTACTTA 5640 
TCAACACCTT TATATTCATT CGATGACTAA TTAATGTCAT TTAAAAGAGT GAGTTATCTT * 5700 

TTTGAGATAA CTTGCTCTTT TTTTCTACCA TGTATATTTT TAAAAATATG AGCGTTAAAT 5760 

TAAACATTTT TCTGATAAAA ATATCCAGTG AATGATAAGA TAATAAACGT ACATACTAAT 5820 
AACTAGTAAA TAGCAGGAGT AAATTTTATT AGAGTTAAAC AATACATAAT TAAAGGGTGG 
TTAACATGAC TAAAACAAAA ATTATGGGcA TATTAAACGT CACACCTGAT TcATTCTcAG 

20 ATGGTGGAAA ATTTAATAAT GTTGAATCAG CTATAAATAG aGTGAAAGCC ATGATAGATG 6000 

AAGGTGCTGA CATTATAGAT GTTGGAGGTG TTTCAACGAG ACCCGGTCAT GAAATGGTTT 6060 
CATTAGAAGA TGAGATGAAC AGAGTATTAC CTGTTGTTGA AGCTATTGTC GGTTT 
26 ' (2) INFORMATION FOR SEQ ID NO: 149: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10401 base pairs 

(B) TYPE : nucleic acid 
30 <C) STRANDEDNESS : double 

(D) TOPOLOGY: linear ■ 



10 



15 



35 



so 



5880 
5940 



6115 



120 
180 
240 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 149: 
TAGATACTGG GnTAAAcaTc AAAAATAtyT GCtTaTTCaC GTGTTTAcGc ' TCCCtCAAAC 60 
GCAACGTTAA TTGCGTGTAA . TCATTTAGTG TGAATTcAGA CGCTTCTTCC ATGACTATCT 
4Q CTGATATGCC TTTTATCGAC TTTATTTTCT CTGGGTTATC TAATCCTTTA AACAAAAAAA 

CTGCGCCGTT TGGCAATTCA ACTTTGTTAT CAGTCTTATT CCAAAGGCAC ATGTCCCAAA 
TACCAAAGTT TATCAAACAA TCTTTAACAT CTTCGAACAA ACTATCTTTA ATTGTTGATT 300 
45. GTACTTTTCT AAGCCACAGT ATACGCCTAG GATATTTCCA ATCTTGCAAT GCTTTGAGTA 360 

CAACTTTTTG TATAACGCCG TGAGACTTAC CGCTCGAACC TCCACCGTAA TGJcACTTCAG ■ 420 
TGAAGTtATC GTAATTGGTT AGTATTTCGA ATATGTTTCT ATTGAAAACA TTAGACGGTT 480 
TGTTAAAGTT TAATTTAACT TTCGTCATCG TACTCACCAA TATTAATCTC AATATTCTTC 540 
TGAGTAATTT CTTTTTTATC GATATACGCA CCATGTACTT TTAGTATGTG GTCAATAGAT 600 
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TTTAAATGGT CATATTTCTT 


ACTGTAAGCC 


TCTTGAGGTT 


CTCCTCTAGC 


AATAGAAGCA 


•720 




GATAACGCTA AAGCTTCTGT 


AATACTCATT 


AAACGCTCTT 


CTTGTATCTG 


TTCTAATCGT 


780 


5 


TCTTTAATAT ATTCCGAAAC 


ATTAACATTT 


CTTAACAATC 


GACTTGCTAA 


AGACTCTGCT 


64 0 




GTTTTCTTAC TATAACCTGC 


TGTAATTGCT 


GCTTTTTTAC 


CATTACATCC 


ATTCATTATA 


900 




TATTCATCTG CGAATCTCTT 


TTGTTTTTCG 


TTCATTTCAT 


TTACCACCAA 


CTCTCGCGCT 


960 


10 


ATACGCTTTT TAAAATTAAA 


AAAGGATTGG 


CTATAATCAG 


CCAACCCACA 


TAGATCCTTT 


1020 




ATTCCTAATT GCGATAAGGG 


AAACG CAGTA 


CGATAGTCAA 


TATCCTACAC 


TATCATAATA 


1080 


15 


TCTCATTTAA GGTATCAAAA ACTGCCACTT TACTGCCAAT TTCAGTCTTC CCCTAACTCT 


1140 


TCCGCCAATC TAGATATGAT TTTTCTTTTG ATTCTATGAG 


CAGTTCTATC 


AGAAATGTGT 


1200 




ATGTCAACAC AAACTTTCAC 


TAATTCCTTT 


TTATTAAAAT 


AATACTCTTG 


AATGAATTCG 


1260 


20 


CGTTCTTTCC TGCTTGATGT 


GTTGATTATA 


CGTTCAATAG 


CGCTCTTAAA 


CTCAAGGATT 


1320 




TTACCTCTTC GTATACTACA 


AAGATAATTA 


GTTACTGCCA 


TTTCTGTTTT 


CGATGTATTA 


1380 




GACGGTAGAA ACTCCCCGCC 


TATATTTGTA 


TCTGTTGGAA 


TCCACGGTGT 


CATTATTTCA 


1440 


25 


CTTCTTAAAT CTTCAAGTTG 


TTTATGATAA 


TTAGGATAAT 


CACACAACTC 


ATCTTCTAAC 


1500 




TTTCGAACTG TTGATAATTT 


TAATCCGTAT 


TTCTTTTTAG 


TCATGAATAC 


CCTCCGTACA 


1560 




AATATGTTTA ATCTTCAAAG 


TGTCTCAATC 


TACTTCTTAA 


TATCTCTATC 


TCTCGCTCTT 


1620 


30 


TAACTTTTAC ATCACCTTTT 


AACTGTTCCG 


CTTGTAACAT 


CACACCAAAC 


AATAAGATGA 


1680 




CTAGTAATAT AATTGCTATG 


ATTAACCACA 


TCATCTACTC 


CGACACCTCC 


GCCCTCATCA 


1740 


35 


AATCAGACTG ATCACTCAAC 


TTTG CGAAGT 


CACTTGGCGC 


CTCTACATCA 


TCATTAGCCG 


1800 


■x TCATCATAAT ATATACTTGC 


TCAGTTACAT 


ACTTACCTAA 


GTCATACATC 


GCTAGTAAGA 


1860 




ATAATAGTCT CAAAATTTGt 


TTAACCACCA 


CTAAACACCC 


CATGTTAATT 


TATCGATAAT 


1920 


40 


TTGTATAGCT TGTTTTAATG 


CGTCTCTTTT 


TTCTTTGATA 


TCTCTATTAT 


CGCCATCTTC 


1980 




ATCAGCTGAC ATTAACTCAC 


TGTCATATTC 


ATATAATAGT 


TCTGATATTT 


CATTACTAGC 


2040 




TACTACTAAT AAGTTTTCAT 


CTAGATCAAT 


CGTTACCGTT 


TTCTTTGGCA 


TCTCCATCTC 


2100 


45 


TCCTTATCTT AACTTGTGCC 


TCGTATTTGC 


GCTCAGCTTC 


TTCTTTACTC 


TCTGCCTCAA 


2160 




CAACTGTAAA CGTCTGATTA 


TCTCTAG CAG 


TAGTAAAATG 


TTCATGTGGT 


TGTCCTGTTG 


2220 




AATCTTTGAA TGTTGTGACT 


AAGTATTGCG 


TCACTTCTTA 


TCACTCCTTT 


GAATGATTCT 


2280 


50 


AAGTTTTTCT ACGAATAAAA 


GTATTAGTAC 


AACACTCAAT 


GTAGCCAACA 




2340 




CTTTGCAAAA TCTACTATAA 


CGATTAAGAC 


TAATAACATT 


CGAATTCTGC 


ATGTAAATAA 


2400 
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TACAAGTATT GGAACTAATG TAATGATGTA ACTCACTTCC CCAAAACCTC CTTGACTCGA 
TCTAAGATGT CTTTACACTC CGCTACTTCC GAAGCCTTTT TCTCCACGTT CTGAAACACT 
TTCGAATTCC TCGACTTGCT TTAGTTCAGG- TGTCCATATA GGCACGATAA CCAATTGAGC 
TAGTTTGTCT CCTTCGTTGA TTTGATAAGT TCCGTATTGT CTTATGGCGT CACTCAAATC 
GATTTCTCCT TTAATATCAA AAACACCTGG TGTGATATAA CCATTCGATG CAATAGCGTC 
ATTCTTGATA TTAATCCCTA AATTGCCGTG ATATCCCGCG TCTATCTTGC CTGTTTCAAT 
CACTAAATGC GTTTTACTAC TTACACCACT ACGGCTAGTT AATAGTCCGA CATAGCCCTC 
TGGTATGCTT ACAGCTACAT CTGTTTTAAT CACTGCCTTT TCTTGTGGCT CAAGTACGAC 
AGTTTCAGCT GAGAATATGT CATAACCTGC ATCCGTCTTA TGATTTCGTT CGGGCATTCT 
AGCATTTTCT GATAATAGCC TTACTTGTAA TGTGTTAGTC ATTTTCCTGC TCCTCCCTAG 
CTGTAGCAAA CGCTATTCTC AATTTCAATC TTTCAACAAT ATGAATTAGT GCGGTATTGA 
GGAATATTTC AAATTCTTCA ATGTTCTCAT CTATAAAATC AAGTATTTCT TCCTCTTGTT 
CACTGTCAAA CTCG CTTAGT ACATCCCAAA TATTTATGTC GCTTTTGCTC GTTTCTAATA 
CTCTTTTGAT TATTTCTGAA TTACTTTTAT TACTCATTTT CCTTGTTCCT CCTCATATTT 
ATAGACAACT TGACCTGCCA TAATCC CTAC TGCTTCATCA AGTTCAATAC CTTCTTTAAC 
TGAATGTTGA AT AG CATTTG TCATTCCCTC AAGTATTTCA TCAAACGCTT GTGCTCTCTT 
ATACACGTCC TCAATCTCTT TTAGTAATCC CTCTGTGTCA TTACCGTTAT ACGCACTAGC - 
ACTGATCACT GATTGTTCAA TTTGTTCGCG GTTATTCATC ATTTCCATCT CCTCTAAAAT 
AAAGTTAGTT GCTTCTGCTC • CTCGTATTCC AAACCATGTT GCTTTATATA TGTTTCGAGC 
TCTTCCGCTG TATCAAATGT CTTTTTCACG CCTTGCCAAC- CTGGCACGAT ATGCCCATGa .- 
AAGTAATAAG TGCCGTTCAC TACATGGATA TGTGCCACTC GTTCGTTATC CTGATACAGA 
TATCTCTTAG ATCCGAAAAA TTGGTTTAAG TATTCTTTAC ATGCGCTATC GGTTTTAGGC 
ATTTATGCTT CCTG CCATTT CTTAAACATT TGGTTATAAG TAGTATCAAA CCAGTACGGA 
TCACGTGAAT GTTTTTGAGG CACATTAAAc" AAATGTGGCT TCTTCTTACG TAGTTCAGCC 
TCTTTACGTC GTTGCCTAGC CATTTCACGC TCTTTGCTCT CTCGCTCCAT GATTTTGGAT 
AACACAATTT CTTTATACTC AGCTAAGCGC ATACCATAAG GTGCATGTAA GGCTTCTAAC 
AACGCCCAGC CACCTCGTAC TCTTTTTGCA AC CATTC CTG GAGTTAAACC GTTCTTTTTT 
ATCAATTCAT TTTCATGTTC GGTAAATTTA TATGGTTTAc CGTTAATCTT TACGATACTC 
ATTTATTCCA CCTCTATACA TTTACTTTTT TTAATCCAAT CCTCTAATTT GTGCGTGTTG 
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ACATTTAAGT TAACCATCTC AGCTTTTCCG TTTTTATATC CACTAATAGT TGATCTTGAT 4320 

ACGCCAGTTT CATTGTGCAA ATCTTGGACA CTTACGTTAT CTCTAGCCAT GATTACCCTT 4380 

5 AAATTAGTTG CGAATACTtC GTTCAACTTC ATTTATTCCA CCTCTATATA TGCATGTCTT 4440 

ATTGTTATGT TGTCATACTT TAGTAATTCG TCCGGATTGT CATCTAAGCG CTTTGCCAGC 4500 

GTATCTTTTT CTTTATCCAC ATCATCGTAA TGCTGATATT CAACTTCTGT AGGTATTCTT 4560 

10 

ATATCAATCG TTGCGTTTAT ATATGCTTGT TGTTGCATTA GATCACTTCA TTTCTCTTTT 4620 

TCTTTTACGT CTGACTTTCA CTAAGTCCTC ATATACCATC CATTCTTGAC CTGTGTATTT 46 80 

AGGCGCTTTA CATATCCACG TTAAATTCAC ATCTCTATAC TGATATCTGA ATATCTTCGC 4740 

IS 

TTTGATGTTG GCAACTTCAG TCGCCTTACC TTTAACGTCT ATAACTTCAA CCAGTTTCCC 4 800 

TTCCTTCCAC AAAGAGAAAT CGGCTATATA CGTAATCGGT CTTTGTTTCC CGAATTTAGG 4860 

2Q TTGTAATTCA AATTTCGGTT GTATTTCGAT ACGATCATAG TTAGTGCCAT TCATATTACT 4 920 

TTCTAAATAT TGGTAATATT CGCACTCTAC TTTGCTATCA AATACAATTC CTTTGTACTC 4980 

AACTTTCTTA GCATTGTATT TACTCATTGT GC CACCTCTA AATATCAAAT ATCGTTGCTT 5040 

25 GCAATCCTAG CTCTTGCTGA TATAGAAGCC CGTGAGCGCC TTTGAATCGT TTTAGGTCAC 5100 

TATCAGTCAT AATTTTCTTT TCGTCGCTGA AATGGGCTCC TGTGAGCGAA TAAACTTCAT 5160 

TTACGTTGTC TTTATACTTG ATGACCTTAA TATCTTCCGT GCCATCTTCT CGGTATAAGT 5220 

30 AATATTTTTC TTTCGGCATT TTTTAACACT CCTTAATGTG TGTTTTCTTC GAGTTGATTT 5280 

CATTCATGAT TTTCTTTTCA ACTCTGTCGT AATCATCGAA AGG CGATAAC TCGTTATTGT 5340 

CCAACAATCT ATTGACCGCC CAACCAGTCT CGATATATAC ATTTGCTACA ATCGGGTCGC 5400 

35 

TTTGCTTTGT CTCTTCATAC ATCGATTTCA ATAAGCTTTT GAATTGCATT ATATTCATGT 5460 

GAAAAACCTC TGAGTCTTCT TGTAATACTC AAATTCAATT ATTCCGGTTT CGCCGTCTTT 5520 

GTTTTTGGCT ATGTTACATT CAACAATAGA TTTGCCAGTG ATACTGTCAT CTTCGTCACG 5580 

40 

GTTATAATAA TCATCACGGT AAAGTAGGAT CGCTAAACTC GCATCTGCTT CTATTCCGCC 5640 

TGATTCTTTC ATGTCGGATA GCATTGGTCT TTTATCCTGT CTAGACTCGA CACCACGATT 5700 

CAGTTGTGAA AGTAGTACGA TGATTGCGCC TGTCTCGTTA GCGATTATCT TTAAGTCACG 5760 

45 

TGATATCTTT TCTACTGCTA CACGTCTATG AACTTTCGCA TCAGTATCCA TCAGTTGAAG 5820 

ATAATCTATA AAAATAACTT GTTGCCTGTC TGAATGCCTC ATTGtTGCGC TCGCACATCT 5880 

50 TGCGGTGTGA TATTACTTTT ATCAGAAATA TCGATGCCTA ATTTCATGAT TTTATCCATC 5940 

GCATTGGTTA ACTTTGTTAA GTCATCCGGC GTTAAGTTCC TGATTTCTTT TATCTTTGTT 6000 
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AGACTAAAGA AAGATGTTTT GTATCCATTT 


' TGTGCTATGT 


TCAGCATCAT 


GTTTAATGCA 


: 6120 




AAACCTGTCT TACCCACTGA GGGACGCGCT 


GCGATGACGA 


TTAATTGTGA 


TGGTTCTAAT 


6180 


5 


CCCCCTATTT TGTAATCCAT 


TAGCTTGTAA 


CCCGTCTTAA 


TTTGCTTCTT 


AGGGCTATCG 


6240 




CTGTATAACT CTTCGACAAA 


CTCCTCAACA 


AACTTCTTGG 


TTCCATCTTC 




6300 


10 


GTAATTGTTT TTAAATCCTT 


GAGTTCATCA 


ATCAAGTTGT 


TAAAGTTTTG 


GTTCGTAGGT 


6360 


TGTTGTTTGA ACTCAGTTAC 


CAATTCGTTA 


GCTTTGTTGA 


GCTGATAACT 


TTCCAATAAT 


6420 




-■ TCTTGTTGAT AACGTTCAAA 


GAAGCCATAT 


CCAATGAAAT 


CGGAGTTGTA AAGTTTAGTT 


6480 


15 


ATAGTATCTG CATCTAAAAA 


TTCTTTATCT 


TTAGTTGCTT 


TTAAATAGAT 


TTCTTGATGA 


6540 




TCTATCTTTC CGACGTCCAT 


TACATAATTG 


AAAAAGGTTT 


TAAACTTTTC 


GTTCGTAAAC 


6600 




ATGTAATCTT TAACTCTTAT 


CTTTTCTAAT 


ACGTCCGGTT 


GTTTAAGTAG 


CGTAGCGATT 


6660 


20 


ATTGTACTTT CAATTTCGAA 


TTGTCCGTAA 


TTCATTCGTT 


TTCGCCCCCA 


AATTCTGCCA 


6720 




ACTTATTCAT GAACTTATCT 


AGCGCTATTT 


TTCTTTGTCT 


GACATATTCG 


GGGTCATTCT 


O / OU 




GCATTTTCCA TTGGTGTGTA 


GCGGTTTCGT 


TATCTACTGG 


CTCGATAGAT 


ACTTTTTTAG 


6840 


25 


. GTTC CTTACG CATGATTGCT 


GGTAAGTTAG 


GCGGGTACGG 


GTTGTTACTG 


TTGATATAAA 


conn 




CATCTACCGC TTTTACAGTT 


GGTTGATAAT 


CTCCATTTTG 


ACTTAATACA 


TCAATCCACA 






TTTCTAACTT CGGTTTATCA 


AAATCAATGT 


TGTATACGTA 


ccTAAcrrrrr 


TTAATAATTT 


7020 


30 


CTAATGCTTG TGTTTTGCTC 


ATCGGCATTA 


GTCATCACTC 


AATTCTTTTT - 


CCATTTGTGC 


■ 7080 




AATGACATCA TCAGTAGTAT 


TTTTTCTAGG 


TGCTATTTTA 


TTTTCTG CAT 


CTTCTTTTGT 


7140 


35 


TTTGACATTC TCTTTAGCCC AGTTGTTTAA AACTTTAATT AAATAG CCAC 


CATGCGCACT 


7200 


TTTGCTTTTA GTGTACTCAA 


CACCTACTTT 


TACAACTTCA AAAGCGTTTG TACCTATATC 


7260 




ATCAATAGCA AACCCTAATT 


GTTCCATTTG 


ATTAGGTGTT 


AACTTATCAT 


CCAAATTTGC 


7320 


40 


AATTATATAT TTTATTGAAG 


ATGAGAAGAC 


GGCTTCTCTT 


TCTTCTTCTT- TATTCTTATA 


73 80 


TTCTT CTTCT TTTTCTTCTT 


CTCTTTCTTC 


TTCTT CTTCT 


GTATCGTTAC 


GTAACGTTAC 


7440 




GGTAACGTTA CGTTTTGCTT 


CTAGTAACTT 


TTTCTGTTTC 


TCACGATAGC 


GTTGTTGTCG 


7500 


45 


CAATTTATTT TTTTCTTTAT 


GCTTAGCTTT 


GCTATCTAAG 


CTTTGATGCT 


TCTCCCAGTT 


7560 




TGTCACTTTT ATGACACCAT 


TAACTTTTTC 


AATCATGCCC 


AATGTCTCAA 


AAGTTTGAAT 


7620 




TGCTAACCTT ATTGAGTTAA 


TAGGTCTATT 


AAATTCATTT 


GCTAACATTT 


CTTCGTTGTA 


7680 


50 


CGGCAAGTTT TCGGATAGCA 


TAATATAACC 


TTGTTCATTG 


TACTTTCCTG 


ATAAAGTTAG 


7740 




TAACTTAACC CAAATAGTTA 


TGATCGTATC 


TCTTTCGGGT 


AAAGCTTCGA 


TATATTTGAT 


7800 
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CTCCTTTCAG 


CATTTTGTTG 


AGCCTCTCAT 


CAACTTTTAX 


CCACGAGTCA 


TGCAAGTGAT 






ATTTATCATC 


AAACGACTTA 


ACGCCAAXXG 


CGTGCTGTTC 


ATTATGATGT 


TGTCTACACA 




5 


GTGCTAACAC 


ATGTTTGTCG 


TAG TGATT CA 


* * X X W A X X W X 


W X X X WWW A 


CTGCCGACTG 

w x wv wwr*w x vj 


BO A O 

OU1U 




CTTCATAATG 


TGCCAGGTCT 


GCGTGAGGCT 


TTCCGCATAT 


TACACAGTTG 


CX3GTTGATTG 


8100 


10 


TAGCCCAATA 


TAATAACG CT 


TT AT CTTC!G C 


X A rlOix/Wv X X 


X "ww X X X \» X 


ACACTCATAG 


oxou 


GTATTTGATG 


ATGAAACATA 




X V^^VVJ X X X— X n X 


TZi A PTPPf 

inAv X wWW X X 


PjP A A PTTTP A 
wUnnu xxx wn 






TAGAACAGTC 


G CGCAGACTG 


AX X X W X X WAX 


.nnWWX X x Wr\ X 


A aTTTOPi TAT 


if"j»I^I^IV.;^T l 'TV 
XWXV9X X XOXA 


q •} en 


15 


n*nn x x x x w x 


BP. f t m 1*i 1 TiTTPT 
nU X X WAX 1 W X 


A P^flf ,!^2TP^PP^2P J 


PPPni^TO. Zi Zi ft 
WW WAV X Vjniiu 


X X W 1A1A1 w X 


W X AWAWAX X VJ 


o J4U 




^flA ATA'i J i'~ i"i * 
^•Uvviini x ^ x 


X x x uCu X 1 vl 


X LlAlnunln 


^php^p^p^p^p a ^ptp 

wX X X X X Inl X 


VJ X V.WUUAALL 


TCTACXTCTG 


OA Aft 

B4UU 




/ "I M t w l w l l ?VPTPPPj 


AlnlVUul X X 


1 X AVi X AALi 1 


CAATGTGACT 


TTG XT CAAGT 


1LAALAL wAlv 


8460 


20 


- TAfirAAmAr* 


an a ata anTa 


WWO X WA ilol 


PTTTPTPPTft 
LI 1 1L X Vtw In 


TPTTPTaaTP 
1L1 X\a InA 1 V7 


XAXTGCAXXX 






& A A PP 2k PftSTP 


/tap » a pppT , 


A A A T^P A T»P 7V *T» 


CATTGATTTC 


XAl lUbALLA 


xXAGCATTAG 


8580 






IVxAX X L» X ivn 


CTCAXTGGCG 


TCTGTTTCCC 


AXXTGCTTGC 


XGXTCXTXTX 


O ^ >l f\ 

8640 


25 


yil 1 J. X W X w 


A 1 X X X 1 A 


vto X 1 W X\jV? 1 X 




XX WAX wvjX w X 


XXATXCCAAA 


a *7 a p* 




Wx X 1 


TP ftp A P^P^TT 1 


ACAAAATACT 


TGCCTTGTTC 


CTCGTTAAAT 


TTATTTTTAA 


8760 




GTACAATAGT 


TCCGATTTTG 


TTAATTAATT 


GATCTGTGTC 


AAAAul XAAA 


lLlliblAAbi 


8820 


30 


TCAATTTAAT 


TCCTAATCTA 


CTAAGTAACT 


CGATATATTG 


XXXXXwXX Vj a 


TAAXCTTGTX 


Q O D A 




GGAATGGTGG 


GACGAATTGG 


TTGTGTTTGT 


ATTGTTTACC 


X X W\J 1 X\7 111 


X wAAAAAwAA 


8 940 


35 


TCGTGAAGTA 


TCTGTTTTCT 


CTGTCGTTAA ACTCGACATT 


X uUnnv X X X X 


arrnTaaaTT 


7 u uu 


CTCCAGCTCC TAAAAAGTCC 


CCACCTTTCA 


TGAATGCCTC 


X X \3n X X X X 


T 1 "I A A*TY2 *T* 
X W X X Vlnn ivs 1 


7USU 




ATTGTGTTCT 


ACCAGTGATT 


TTCATAATTT 


TTATACCGTC 


WX X X 1/V\t ±4\ 


^%X XXX X^w%X X 




40 


ACCATTTCTA 


ATTGCTTGTA 


CAACATCGTT 


AATACTTGGA 


TTAAXGAAAC 


(ITTI *CV I"** I v/^*r r p 

v3 XXX W X X X X 


9 180 




AATTTTGATG 


TTGCTTGAGT 


GTCTTATCTT 


TGTCTCGAAT 


AAATTTGATG 


VJ X X V_~TW7V_»V7 x X 


9240 




AAGTACATAT 


TGATAAGTTT 


TTTCGCCGTC 


TTGCTCATGT 


TCTTCTATTG 

X Xm* X iWln* X 


*T , PAT*Xf^TT , ^f** 

X Wll XWX X WW 


9300 


45 


TAACACGTCA 


GATTGACTGA 


TGACTGCTXX 


i"X"X"xATTTGG 


TCTXGXGCCT 


CTATCGTGAT 


9360 




TGTTGGATTG 


ATAGTACTTC 


CCTCATCATC 


TTTGTCTTTG 


TTAATGCCCT 


CGTGTCCGCT 


9420 




TATAGCAAGA 


TGAAATTGAT 


AATGTTCTTG 


TAATTTAGAA 


ATATAACGAT 


AAATACTTAC 


9480 


50 


AATGCGTGTA 


GCACACTCGC 


CCCAATCATT 


AAATGTCGGT 


TTCTTTGATT 


TACCGTCCAT 


9540 




GATGTCGTCC 


ATAGTGATAT 


CACGTAACTT 


TTGGATTGTT 


TCAATCACTA 


CAACATCAAT 


9600 
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AAAATGCTTA TAATTCTTAA TCTGCACAAC TGCCCCATCT TCTGTTACCG TTGTTCCGTC 
CTCATTTATA TCTAGTACTA AGGCATTGTT ATCTTTTGTT AAAAACGTAG TTTTACCAGT 
ACCGAACTTG CGGTATATCG GAAATTTATA AAACTTGTTT GCATTTTGTT TGCTGATGTC 
TTTTACACCT AGTTGCGTTA AAATATCGAC ATCTTGATTA GTTTTTTCAG TCATCTATTC 
TCCCACCTTT ACCGTGTATG ACGTTGGTTT CTCCACAATG CTAGGACCCT CTAAAACTTC 
GCCGTTTGCG TCAATCAATG TGCCGTTTTC AGTTACATTG AAATCTTTCT TAATGTCTGA 
TTGGCTAAGT TTTTTAGTTA CTTTTACATA GTTGTCAAAA CCTCGTTGCT CAAGTTGTnT 
AATGACTTCT TGCTCATTGC TAACTTGAAT GACTTTTGAA CCTTTTCTGG CTGTCACTTT 
TCCGTAAGtG TATTCAACTT GAATTTGCTA TCTTGTTCTT TTTGTATTCT GTAATATTCA 
ATTACAAGGC TTTGTAAATA TTCTTTGCCA CTCTGTAATT TTTCTACTTC TTTATCTTTC 
CATTCGTTTA TGCGTTCAAT TTCTTTATTT GCTAAATCGT TGATTTCATT CTCTTTAGTT 
GTGATTGCAT CCAGTTTCTn AAAAACCCAG TTAGCACTGT CTAGATCAGT nACTTTGAAT 
CGGTCGT CTT GTTCGAATGT n ■ \\ ■ . 

(2) INFORMATION FOR SEQ ID NO: 150: 

(X) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 2989 base pairs 

(B) TYPE: nucleic acid 
tC) STRANDEDNESS : double 
(D) TOPOLOGY: linear 



9720 
.". 9780 
9840 
9900 
9960 
1002O 
10080 
10140 
10200 
10260 
10320 
10380 
10401 
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(xi) SEQUENCE DESCRIPTION: SEQ ID-NO:* 150: 
TTTCTCTCTA TTATTCTCGA TGCGTAGATA ATTGTTTAAA TTTAAGTTTA TAGTAATGTT ; - : - 60 

GAGTTTATAA TTTCATATAT CTAAAAACAG GTGTTGTATA TATAATCATT CATCTAGTTA 120 

TACTTACTTT AAAAATAATA TAATTTCATG CGATGCAATT CATTGATGGA TGTTTTTAAT 180 

CTTAATCAAA TCCAaATAAA G CATAT ATTT TTAAATTCAC TTTCTTTCGA ATCGATTTTT 24 0 

ATCTCTTGnA TTAAACTTTT CCATTGTTTC ATTAAAGCTC TCTGTCATAT CTATTC C CAT 300 

TGAATTCGCT AAACATAACA ACACAAATAA ATTATCACCT AATTCTGCTT TAATCGTATT 360. 

TGCTTCCTCT GAATCTTTCT TCTTTTTTTC ACCATAGGTA TGATTTATTT CACGTGCAAG 42.0 

TTCGCCCACT TCTTCAGTCA ATCTAGCTAA GTTAGCTAAT GGTGAAAAAT ATCCTGTTTT 480 

AAATTGTCCA ATATATTCAT CAACTTCACG TTGCATTTCT ACCATTGATT TCATTTCTAC 540. 

GTTCTCCTTA TATTGCATTT CTAATATAGT ATATATCAAT TTGAAGTCTC ATGCATGTTT 600 
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AATTCAGTTT ATATAAATGT AATGCATTCC TAACTAAATT AAATCAATTG AAATTGGGAT 720 

TATAACTTTA TGATACGTAC CACTACAATA AAATAATATA GTGAATAATC TACCATTAGA 780 

AAAATAAGCA CAAAAAAACT AGCAACCACA CAAAAATGTG ATTAGCTAGT TAATAAGTGT 840 

CTAATTTAAG TTAATTGTTA ATCTATAAGA TTAATCACTT GAACGCGCAA TCAAAATAAT 900 

ACGTACAAGC TCTGCTACAG CGACTGCAGT TGCTGCAACA TAAGTCATTG CTGCTGCAGA 960 

TAATACTTTA CGCGCATGCT TGTATTCTTT TTCATTTACA ATGTTCAATG CCGTAATTTG 1020 

TTTCATCGCT CTTGAACTCG CATCAAACTC AACTGGTAAC GTAACAATTG AGAATAATAC 1080 

CGCTAATGAC ATTAAACCAG CACCAATCCA TAAAGCAGTT GAACCaAATG CACTACCTAT 1140 

CGCTGTTAAG ATAATACCTA ACATGATGAT CATATAACTT AATGAACTCC CTAGGTTTGC 1200 

AACAGGTACT AATGCTGCTC TGAATCTTAA GAACCAATAT CCTTGGTGAT CTTGAATGGC 1260 

20 ATGACCAACT TCGTGGGCTG CAATTGCAGT TCCAGCAACT GATGGTCTGT CATAGTTTGC 1320 

AGGAGATAGT GAAACAACTT TCTTTTTAGG ATCGTAATGA TCTGTTAAGA ATCCTTCACC 1380 

TTTAACAACT TCGACATCAT AAATACCGTT TGCATGTAAA ATTTCTAATG CAACTTCACG 1440 

25 ACCCGTTTTA CCACTAGTTG ATCTAACTTG TGAATATTTC TCATAGTTAG ATTTAACTTT 1500 

GTGTTGTGCC CATAAAGGAA GCACCATTAA TATTACGAAA TAAATTATCA TAGTAAAAAT 1560 

TGAAGACAAT AAACTCACTC TCCTTTATAA ATATTTTACT GTCATTTGCC GTTTTTATCA 1620 

3D r 

AATCATTTAC ACTTTAATAA TTTGTTTAAT TCAATATAAA GCAAAAGTCC AAAAACACTT 16 80 

AGACAACATG ATAATACACC AATTTGCCAC ACATGTGTAG TTATAAAATC ATAATATGGA 1740 

AATTGAAGGT GAAAATAGTC AATATAATCA TTCAAAAACA CCCAAATCAT yGCTACACTG 1800 

ATTCCAATCA TAGAACGTTT AAACCTAGGA TAGAAGTAAA TTGCCTGAAC AGCCATTATA 1860 

CTGTGGGAAA ACATTAATAC CAAACCATTT ACTGTAATAT CACCTTGTTC AATAATAAAT 1920 

AATATATTCA TTATAACTGC CCAAATCCCA TATTTGAATA ATGTTACAAA TGCCAGTGCA 19 BO 

TCGATAATAC TATTTTGTTT TTGAATTAAT ATCAATGAGA TAGAAATAAC TAAGTATAAT 204 0 

ATTGCAGTTG GGCTATCTGG AACAAAAATC TTAAAATGCC AGGGCGTATG ACTTAATTGT 2100 

4S TCACCATACC AT AT ATAAC C ATAAATCATC CCTAATATAT TACAAATGAG TAGCATCATT 2160 

AACCAAGAAC GTTGATAAAG TGTATATTGC CAAAATGCTT TAATTGTCAT CTGCTAAGTC 2220 

CTCAAATTGA TTATGTTTAT TTACTAGCTT GAGTGTATTT AAAATTTGCG TTAGTTGATA 2280 

60 AAAACGTTGC TTTTCATTCA TCTGTAAACT TAAATCAATA TTGTGTAACA AGTAATCTAT 2340 

TAATAACGCA TGTTTATGCC GATCTATAGC CATACTATTT AAGTCATGAA GATAAGTTTG 2400 
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TGACACGTTT GCGAAGTGAA TTTGAATATC AAAAGCACAG TTATGATTAG CGATATAATC 
AAATATTTCA TTTGTATTCA TTAACTTTAT ATTACGCTTA GTAAATTGAA TTGCAGAAGC 
GTGACTTCCC ACTTCTGCAA TTTCTAATGT TTCATGATGA TTAATTTTTG TATCTACAAA 
ATGAATGTTT GCGAATTTCG CCTCATTCAC TTTTATATAG TTAAGCACCC AAACTGCAAT 
ACGCGACTTA AATCGATATT GAAAAAGTAA ATATTCAATA AAACTTTCTT TAATTTGATT 
GAGTGTCTCT GACATCAAAT ACCCCATTTT AAGATTGCAA TCTTGaTAAT TCGTCATGCC 
AATTTTCGTT ACTTGGcTCT AGTTCCAACA ATTGATTTAA AATAGTAATT GCTTGTTCCT 
TTTGACCAAT TTCAATTAAA TAGAAATAAT AATCACTCAT AAAATCAATA TTTGTTTTCA 
TCGTTGGATA TGCTAATTCA AAGAAATGTT GAGCTTCTTT ATCTCGCTC 
(2) INFORMATION FOR SEQ ID NO: 151: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1143 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 151: 
CATCAACTCC TTAATTACAC TGTAAATGAT ATGCGTCTTT TTGACAACTA- TATTTGTCAA 
ATCTACACCA AAAAATATGA TTATCCACCT ATGTATGACA TTTTGAAACA AACACCTCAA 
CGCCTACAAG TCATAATTGT TTACTTTCGT TACACCTTCC TGCATAATTA ACAGCATTCT 
AATTTTAGTA TGATGCACGC ATTTTCACTA AATCAAACCA TTCAAAGGAG ACTATTATGG 
CATTTACATT ATCTGCAATT CAACAAGCAC ATCAACAATT - TACTGGTGTT GACTTTCGAA 
AACIATTCAA AGCTTTTAAA GATATGGGGA TGACTTACAA TATCGTCAAC ATTCAAGATG 
GCACTGCAAC ATACGTACAT CAATCAGAAG ATGATATCGT TACGTCATCT GTAAAAAGTA 
ATCATCCTGT TGCTCAAAAA TCAAACAAAA CAATAGTTCA AGACGTCTTA ACTAGACATC 
AACAAGGGCA AACAGATTTT GAAACATTTT GTGATGAAAT GGCTGAAGCT GGCATTTATA 
AATGGCATAT CGATATTCmA GCGGGCACTT GTACTTATAT CGACTTGCAA GACCAAGCTG 
TTATTTCAGA ATTAATCCCT CAATAAACTA TATTTATAGC AACATTTTAA TTATTTCATA 
AAATTTTATT GATAATCATT ATCGTTCGGT ATAAAGTAAA TACTATATAC TACTTATGAG 
TGAGGTTGAT TATCATGATA ACTAACACTT TTATTTTAGG CATCACAGGC CCAACAAGTC 
TTGTCGTCAT TAG CATTATC GCTTTAATTA TTTTTGGTCC GAAAAAATTA CCACAATTTG 
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AGTCTCACGA TACACCCAGT AAGGAATCGA AACAACAGCG AGAGCAATAG CACTGACCAC 960 

ACCTTACTGG TTCACTTTAG CGAACTACGC CATGGGTTAG TAAAAATTTT ATTGTCGTTC 1020 

GTCATTACGG TCATCGTCGT ATATGTyTCA TCATTTTGGT GGATGACACC ATTCATAACG 1080 

TATATyACCC GgCACATGTG TcCTTACATG CATTTcATTC ACAGAAATGA TACAAATAAC 1140 

GTG 1143 



10 

(2) INFORMATION FOR SEQ ID NO: 152: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 7953 base pairs 
. (iS) TYPE: nucleic acid 

15 (C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 152: 



25 



30 



35 



40 



45 



SO 



CAACGCCTGA 


ACGTAAACCA 


TATCGTTTCG 


CGATTTCCTC 


ATCTTGACTA 


TTTACTAAAA 


60 


ACTCTCTCAT 


GGCGATTAAT 


GTTTCTTTTT 


CTTCTTTAGT 


TAATGGTAAT 


TCTAACTCAG 


120 


CTGCTTTTTG 


ACG GAAAGTT 


GGATGACCAT 


CTCTAATGAT 


GTCTTTCATT 


GTTAACATAT 


180 


ATTG CACCTT 


CCTTATTTTA 


ATTTGTTTTA 


GTTGAATGAC 


AGTAAAAAGG 


TTGTTAAGAT 


240 


ACTCATAGAT 


TTTTATGTGT 


AAATATCTAC 


AAAGTTAACC 


AACTACTGCC 


AATGTTTATT 


300 


TTAGATAGTA 


TATGTAAATT 


TTCAaGAtAT 


GCgTAATTGC 


gTTAAAAAAT GaTTAAAGTG 


360 


TTGGTTTCAA 


GCAATGaTAC 


TTTAGAAATT 


TATTTATCAT 


CTTGACTTTA 


AAAATTATAT 


420 


TATAAATGAC 


GTAACTGTCA 


ACAGAT AT AC TTAGTArTGA 


AGATGTGTAA 


TGt'AATTGTT 


480 


TAAAATTGAT 


TTCCAAGCAG 


ATTTTATTTA 


TCATTTAATT 


TAAATAGCAA 


GTGGAGGTAC 


540 


AAGH^ATGAA 


ATTTGGAAAA 


ACAATCGCAG 


TAGTATTAGC 


ATCTAGTGTC 


TTGCTTGCAG 


600 


GATGTACTAC 


GGATAAAAAA 


GAAATfAAGG 


CATATTTAAA 


GCAAGTGGAT 


AAAATTAAAG 


660 


ATGATGAAGA 


ACCAATTAAA 


ACTGTTGGTA 


AGAAAATTGC 


TGAATTAGAT 


GAGAAAAAGA 


720 


AAAAATTAAC 


TGAAGATGTC 


AATAGTAAAG 


ATACAGCAGT 


TCGCGGTAAA 


GCAGTAAAGG 


780 


ATTTAATTAA 


AAATGCCGAT 


GATCGTCTAA 


AGGAATTTGA 


AAAAGAAGAA 


GACGCAATTA 


840 


AGAAGTCTGA 


ACAAGACTTT 


AAGAAAGCAA 


AAAGTCACGT 


TGATAACATT 


GATAATGATG 


900 


TTAAACGTAA 


AGAAGTAAAA 


CAATTAGATG 


ATGTATTAAA 


AGAAAAATAT 


AAGTTACACA 


960 


GTGATTACGC 


GAAAGCATaT 


AAAAAGGCTG 


TAAACTCAGA 


GAAAACATTA 


TTTAAATATT 


1020 


TAAATCAAAA 


TGACGCGACA 


CAACAAGGTG 


TTAACGAAAA 


ATCAWAAGCA 


ATAGAACAGA 


1080 
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AAGAAAAGCA AGACGTTGAT CAATTTAAAT AATTAATATA ATACAGATGG TAGGAAACAA 1200 
CTAATACAGT TCCTATTATC TGTATCTTTT TTTATTAAAA CAGAACTTTT TCAAATGGTT , 1260 

TAACAGTCCC ATTTATTTGT GGTACAATTA GTAAGGATAA AATGAATTTC TATACAATTA 1320 

TGGGAAAGGT ATTGTGAATT GAATGGCTCC TAAGTTACAA GCCCAATTCG ATGCAGTAAA 1380 

AGTTTTAAAT GATACTCAAT CGAAATTTGA AATGGTTCAA ATTTTGGATG AGAATGGTAA 1440 

CGTCGTAAAT GAAGACTTAG TACCTGATCT TACGGATGAA CAATTAGTGG AATTAATGGA 1500 

AAGAATGGTA TGGACTCGTA TCCTTGATCA ACGTTCTATC TCATTAAACA GACAAGGACG 1560 

TTTAGGTTTC TATGCACCAA CTGCTGGTCA AGAAGCATCA CAATTAGCGT CACAATACGC 1620 

TTTAGAAAAA GAAGATTACA TTTTACCGGG ATACAGAGAT GTTCCTCAAA TTATTTGGCA 1680 

TGGTTTACCA TTAACTGAAG CTTTCTTATT CTCAAGAGGT CACTTCAAAG GAAATCAATT 1740 

20 CCCTGAAGGC GTTAATGCAT TAAGCCCACA AATTATTATC GGTGCACAAT ACATTCAAGC 1800 

TGCTGGTGTT GCATTTGCAC TTAAAAAACG TGGTAAAAAT GCAGTTGCAA TCACTTACAC 1860 

TGGTGACGGT GGTTCTTCAC AAGGTGATTT CTACGAaGGT ATTAACTTTG CAGCAGCTTA 1920 

25 TAAAGCACCT GCAATTTTCG TTATTCAAAA CAATAACTAT GCAATTTCAA CACCAAGAAG 1980 

CAAGCAAACT GCTGCTGAAA CATTAGCTCA AAAAGCAATT GCTGTAGGTA TTCCTGGTAT 2040 

CCAAGTTGAT GGTATGGATG CGTTAgcTGT nATATCAAGC AACTAAAGAA GCACGTGAGC 2100 

GCGCAgTTGC AGGTGAAGGT CCAACATTAA TTGAAACTAT GACAT ATCGT TATGGTCCTC 2160 

ATACAATGGC TGGTGACGAT CCAACTCGTT ACAGAACTTC AGACGAAGAT GCTGAATGGG 2220 

AGAAAAAAGA CCCATTAGTA' CGTTTCCGTA AATTCCTTGA 1 AAACAAAGGT TTATGGAATG 22 80 

AAGACAAAGA AAATGAAGTT ATTGAACGTG CAAAAGCTGA TATTAAAGCA GCAATTAAAG - 2340 

AGGCTGATAA CACTGAAAAA CAAACTGTTA CTTCTCTAAT GGAAATTATG T ATGAAGAT A 24 00 

TGCCTCAAAA CTTAGCAGAA CAATATGAAA TTTACAAAGA GAAGGAGTGG AAGTAAGCCA 24 60 

40 

TGGCACAAAT GACAATGGTT CAAGCGATTA ATGATGCGCT TAAAACTGAA CTTAAAAATG 2520 

AC CAAGATGT TTTAATTTTT GGTGAAGACG TTGGTGTTAA CGGCGGTGTT TTCCGTGTTA 2580 

45 CTGAAGGACT ACAAAAAGAA TTTGGTGAAG ATAGAGTATT CGATACACCT TTAGCTGAAT 2640 

CAGGTATTGG TGGTTTAGCG ATGGGTCTTG CAGTTGAAGG ATTCCGTCCG GTTATGGAAG 2700 

TACAATTCTT AGGTTTCGTA TTCGAAGTAT TTGATGCGAT TGCTGGACAA ATTGCACGTA 2760 

50 CTCGTTTCCG TTCAGGCGGT ACTAAAACTG CACCTGTAAC AATTCGTAGC CCATTTGGTG 2820 

GTGGCGTACA CACACCAGAA TTACACGCAG ATAACTTAGA AGGTATTTTA GCTCAATCTC 2880 
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CTATTAGAAG TAATGACCCA GTCGTATACT 
GTGAAGAAGT ACCTGAAGAA GAATATACAA 
5 AAGGTAATGA CATTTCAATC ATCACATACG 

CAGAAGAACT TGAAAAAGAT GGTTATTCTG 
CAATCGATGT TGACACAATT GTAGCTTCAG 

10 

AAGAAGCACA ACGTCAAGCT GGTGTTGGTG 
CAATCCTTTC ATTAGAAGCA CCTATTGGAA 
TCACTCAAGC TGAAAATGTT TGGTTACCAA 

15 

AAACTTTAGA ATTTTAATAC ATTTTAAAAG 
GATTAAAATG AAATGTTTAA TTTACGAAAT 

2Q TTAGATTACC CGATATCGGG GAAGGTATCC 

AAGCTGGAGA TACTATTGAA GAAGACGATG 
TAGTAGAAAT CCCATCACCA GCATCTGGTA 

25 CAGTAGCTGT AGTTGGTGAC GTTATTGTTA 

AATTTAAAGG TCATGATGAT GATTCATCAT 
CAgcAGaGCA AG CACCTGTA GCTACTCAAA 

30 AAGCAATGCC TTCAGTACGT AAATACGCAC 

CTGGATGTGG TAAAAATGGT CGTATTACAA 
GTGCACCAAC AGCTTCAAAT GAATCAGCTG 

35 

CTCCTGCAGC ACCTGCAGCA GTAACATTAG 
TCCCTGCTAT GCGTAGAGCA ATTGCGAAAG 
ATGTAACATT AATGGATGAA ATTGATGTTC 

40 

AAGAAATCGC AGCTGAACAA GGTACTAAGT 
TTGTTTCTGC ATTGAAAAAA TACCCAGCAC 

4S AAATCGTTCA TAAACATTAC TGGAATATCG 

TAGTACCTGT TGTTAAACAT GCTGATCGTA 
ATGAATTAGC TGTTAAAGCA CGTGATGGTA 

SO CATGCACAAT CAGTAATATC GGTTCAGCTG 

ACCCAGAAGT AGCAATCTTA GGAATTGGCC 

55 



TAGAGCATAT GAAATTGTAT CGTTCATTCC 3000 

TTGACATTGG TAAGGCTAAT GTGAAAAAAG 3060 

GTGCAATGGT TCAAGAATCA ATGAAAGCTG 3120 

TTGAAGTAAT TGACTTACGT ACTGTTCAAC 3180 

TTGAAAAAAC TGGTCGTGCA GTTGTAGTTC 3240 

CAGCAGTTGT AGCTGAATTA AGTGAACGTG 3300 

GAGTTGCAGC AGCAGATACA ATTTATCCAT 3360 

ACAAAAATGA CATCATCGAA AAAGCAAAAG 3420 

TTAACGAAGT TAGCGTATTT TAGTCTCATT 3480 

CTTAGGAGGG CAAAAACGTG GCATTTGAAT 3540 

ACGAAGGTGA AATTGTAAAA TGGTTTGTTA 3 600 

TTTTAGCTGA GGTACAAAAC GATAAATCAG 3 660 

CTGTAGAAGA AGTTATGGTA GAAGAAGGTA 3720 

AAATCGATGC ACCTGATGCA GAAGATATGC 3 780 

CTAAAGAAGA ACCTGCGAAA GAGGAAGCGC 3 840 

GTGAAGAAGT AGATGAAAAC AGAACTGTTA 3 900 

GTGAAAAAGG TGTTAACATT AAAGCAGTTT 3 960 

AAGAAGATGT AGATGCATAC TTAAATGGTG 4020 

CTTCAG CTAC AAGTGAAGAA GTTGCTGAAA 4 080 

AAGGCGACTT CCCAGAAACA ACTGAAAAAA 414 0 

CAATGGTTAA CTCTAAG CAT ACTGCACCTC 4200 

AAGCATTATG GGATCACCGT AAGAAATTTA 4260 

TAACATTCTT ACCTTATGTT GTTAAAGCAC 4320 

TTAACACTTC ATTCAATGAA GAAGCTGGTG 4380 

GTATTGCAGC AGACACTGAT AGAGGATTAT 444 0 

AGTCTATTTT CCAAATTTCA GATGAAATTA 4500 

AATTAACAGC CGATGAAATG AAAGGTGCTA 4560 

GTGGACAATG GTTCACTCCA GTTATCAATC 4620 

GTATTGCTCA AAAACCTATC GTTAAAGATG 4680 
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ATGGTGCAAC 


TGGCCAAAAT 


GCAATGAATC 


ACATTAAACG 


TTTATTAAAT 


AATPPAfSAAT 


A O ft ft 




TATTATTAAT 


GGAGGGGTAA 


AACATGGTAG 


TTGGAGATTT 


CCCAATTGAA 


A C Af3 AT APT A 


a a c t\ 


5 


TAGTAATCGG 


AGCAGGTCCT GGTGGATACG 


TTGCAGCAAT 


TCGTGCAGCT 


P A ATT IlCZCZ A f* 






AAAAAGTAAC 


AATCGTTGAG 


AAAGGTAATC 


TTGGTGGTGT ' TTGCTTAAAC 


f3T A 1Y1T A 
O X n\j\xc\ loin 




10 


TTCCTTCAAA 


AG CATT ACT A 


CATGCTTGTC 


ACCGTTTTGT 


TGAAGCACAA 


21 ■ I l *r "i 21 21 H 


C ft >l ft 


- ACTTAGGTGT 


TATTGCTGAA 


AGTGTTTCTT 


TAAACTTCCA 


AAAAGTTCAA 


IxAAX X Lnnn 1 


5X00 




CATCAGTTGT 


TAAT AAATTA ACTGGTGGTG 


TTGAAAGCTT 


ACTTAAAGGT 


AAV_*AAAvj 1 XA 


516 0 


15 


ACATCGTTAA 

/Iwt X WSJ X X 


AGGTGAAGCA 


TATTTCGTAG 


ATAACAATAG 


CTTACGTGTT 


AloviAUtxAAA 


5220 




AGA£»TY2r*Ar*A 


AACATACAAC 


TTTAAAAATG 


CAATCATTGC 


AACAGGTTCA 


AGACCAATTG 


5280 






TTTCAAATTC 


GGTAAACGTG 


TTATCGACTC 


AACAGGTGCT 


TTAAACTTAC 


5340 


20 


A & n a a fi*r a r*r* 


aGGTAAATTA 


GTTGTAGTTG 


GTGGAGGATA 


CATTOGATCA 


GAATTAGGTA 


5400 






TAACTTTGGT 


TCAGAAGTAA 


CCATCCTTGA 


AGGTGCTAAA 


GATATCTTAG 


5460 




V» X LAat- X 1 v_*jA 


AAAACAAATG 


ACACAACCTG 


TTAAAAAAGG 


TATGAAAGAA AAAGGTGTTG 


5520 


25 


AAA i X I At- 


TGAAGCTATG 


GCTAAATCAG 


CTGAAGAAAC 


AGATAACGGA 


GTTAAAGTTA 


55B0 






TAAAGGCGAA 


GAGAAAACAA 


TCGAAGCTGA 


TTATGTATTA GTAACTGTAG 


5640 






AAACACAGAC 


GAATTAGGCC 


. TAGAAGAATT 


AGGTGTTAAA 


TTCGCTGACC 


5700 


30 


* GTGGATTATT 


AGAAGTTGAT 


AAACAAAGCC 


GTACGTCTAT 


CAGCAATATC 


TATGCAATTG 


5760 




GTGATATCGT 


TCCAGGTTTA 


CCACTTGCTC 


ACAAAGCTAG 


CTATGAAGCT 


AAAGTTGCTG 


5820 


35 


CTGAAGCAAT 


TGATGGTCAA 


GCTGCTGAAG 


TTGATTACAT 


TGGTATGCCA . 


GCAGTATGCT 


5880 


TTACTGAACC 


AGAATTAGCT 


ACAGTTGGTT 


ATTCAGAAGC 


GCAAG CTAAA 


GAAGAAGGTT 


5940 




TAGCAATTAA AGCTTCTAAA TTCCCATATG 


CAGCAAATGG 


TCGTGCATTA 


TCATTAGATG 


6000 


40 


ATACTAACGG 


ATTTGTTAAA 


CTTATTACAC 


TTAAAGAAGA 


TGATACTTTA 


ATCGGTGCTC 


£L ft C ft 




AAGTAGTTGG 


TACTGGTGCA 


TCAGATATTA 


TCTCTGAATT 


AGGTTTAGCA 


ATTGAAGCTG 


C 1 *5 ft 




GTATGAATGC 


TGAAGATATC 


GCATTAACAA 


TCCATGCACA 


TCCAACATTA 


GGTGAGATGA 


£ 1 Q ft 


45 


CTATGGAAGC 


AGCAGAAAAA 


GCTATCGGAT 


ACCCAATCCA 


TACAATGTAA 


TAACTGATTA 


6240 




T CT AT AAAGA 


TTCAGTCATT 


AAAAGCTGTA 


GCATATGCTA 


CGGCTTTTTT 


GTTTTAGGTA 


6300 




AAGTAATGTA 


AGGAAATTGA 


TTTGAGATAT 


CGTTAACATG 


TGACATGCAT 


GTTATACTAG 


6360 


SO 


CGATGCTAAT 


AAAAGAATTG 


AAATGGAGGG 


TTCAACAATG 


GAATATGAGT 


ATCCAATTGA 


6420 




TTTAGACTGG 


AGTAATGAAG 


AGATGATTTC 


AGTGATAAAT 


TTCTTTAATC 


ATGTAGAGAA 


6480 
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AATTGTGCCT GCTAAAGCAG AGGAAAAACA AATTTTTAAT ACTTTCGAAA AAAGTAGTGG 6600 

CTATAATAGT TACAAAGCAG TTCAAGATGT AAAAACTCAC TCTGAAGAAC AAAGAGTAAC 6660 

5 AGCTAAAnAA TAATTCGTTC GAAATTAACA CAATTTAATA GGAATTTTTC TTTAAAACTA 6720 

TTGCTAATAA AG CT AT ATTT TGATACCTTT ATCAAGTGTT AAACAAAATG TTTGATAAAA 6780 

GTAAACTTAA TATAGCTTTT TTAGGTGGAA AAATAAATGA ACATAGGTAA TAAAATTAAA 6840 

10 

AATCTTAGAA GAATTAAAAA TTTAACGCAA GAAGAACTTG CTGAACGTAC AGACTTATCG 6900 

AAAGGCTACA TTTCACAAAT AGAAAGTGAA CATGCCTCAC CAAGT ATGGA AACTTTCTTA 6960 

AATATTATAG AGGTGTTAGG AACGACGCCA AGTGAATTTT TTAAAGACAG TGAAAATGAA 7020 

15 

AAAGTATTAT ACAAGAAGGA AGAACAAGTT ATTTATGATG AGTATGATGA AGGTTATATA 7080 

TTAAATTGGT TAGTTTCAAA GTCAAATGAA TATGATATGG AGCCATTAAT ATTAACTTTA 714 0 

2Q AAGCCTGGAG CATCATATAA AAATTTTAAT CCATCAGAGT CTGATACGTT TATTTATTGT 7200 

ATGTCAGGTC AGATAACACT TAATTTAGGC AAAGAGATAT ATCAAGCACA AGAAGAAGAC 7260 

GTTTTGTATT TTAAAGCACG AGATAATCAT CGTTTGTCAA ACGAATCAAA CAATGAAACA 7320 

25 CGAATACTTA TTGTAGCGAC AGCTTCATAT TTATAGGGGG GATCTTATTT GGAACCGTTA 7380 

TTATCATTAA AATCAGTTAG TAAAAGCTAT GATGATCTTA ATATCTTAGA TGACATAGAT 7440 

ATTGATATTG AATCAGGATA CTTTTATACA TTATTAGGTC CTTCAGGTTG TGGTAAAACA 7500 

30 ACAATTTTAA AATTAATTGC AGGGTTTGAA TATCCTGACA GTGGTGAAGT GATTTATCAA 7560 

AACAAACCAA TTGGTAATTT ACCACCAAAT AAACGTAAAG TGAATACAGT CTTTCAAGAT 7620 

T ATG CATT AT TTCCACACTT AAACGTCTAT GATAATATCG CTTTTGGTTT GAAATTAAAA 7680 

35 

AAATTATCAA AAACCGAAAT TGATCAAAAA GTAACTGAGG CATTAAAATT AGTAAAACTT 7740 

* ■ 

TCAGGTTATG AAAAAAGAAA TATTAATGAA ATGAGTGGCG GACAAAAGCA ACGTGTTGCA 7800 

ATTGCACGTG CTATCGTAAA TGAACCAGAA ATATTATTGT TAGATGAATC TTTATCCGCA 7860 

40 

TTAGATTTGA AATTGCGTAC TGAAATGCAA TATGAATTAC GAGAATTGCa ATCTAGATTA 7920 

GGtATTACAT TTATATTTGT aACACATGAT CCA 7953 
45 (2) INFORMATION FOR SEQ ID NO: 153: 

(i) SEQUENCE CHARACTERISTICS r 

(A) LENGTH: 234 7 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
so (D) TOPOLOGY: linear 
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GGCGTGATCA TACGACCGTC ATTCATGCTC ATGAAAAAAT ATCTAAAGAT TTAAAAGAAG 






ATCCTATTTT 


TAAACAAGAA 


GTAGAGAATC 


TTGAAAAAGA 


AATAAGAAAT 


GTATAAGTAG 


JL & \J 


5 


GAAACTTTGG 


GAAATGTAAT 


CTGTTATATA 


ACAGCACTAA 


TGATnACAAT 


CATTTTTTAC 


• 1ft 0 

X O \J 




ATTTCTATAT 


GCTAATGTGG 


CAAGATGAGC 


AAAACTCATT 


TTGTGGATaA 


TGTTTaAAAG 




10 


TCATACACAC 


CATACACAAG 


TTATCAACAT 


GTGTATAAyT 


cGcCAAATCT 


ATGTTTTTAA 


■ JUU 


GACTTATCCA 


CCAATCCACA 


GCACCTACTA 


CTATTACTAA 


GAACTTAAAA 


CCTATATAAT 


JOU 




TATATATAAA 


CGACTGGAAG 


GAGTTTTAAT 


TAATGATGGA 


ATTcACTATT 


AAAAGAGATT 


*t ^ u 


15 


ATTTTATTAC 


ACAATTaAAT 


GACACATTAA 


AAGCTATTTC 


ACCAAGaACA 


ACATTACCTA 


A Q f\ 




TATTAACTGG 


TATCAAAATC 


GATGCGAAAG 


AACATGAAGT 


TATATTaACT 


GGTTCAGACT 


54 U 




CTGAAATTTC 


AATAGAAATC 


ACTATTCCTA 


AAACTGTAGA 


TGGCGAAGAT 


ATTGTCAATA 


C rt A 

b u u 


20 


TTTCAGAAAC 


AGGCTCAGTA 


GTACTTCCTG 


GACGATTCTT 


TGTTGATATT 


ATAAAAAAAT 


660 




TACCTGGTAA 


AGATGTTAAA 


TTATCTACAA 


ATGAACAATT 


CCAGACATTA 


ATTACATCAG 


720 




GTCATT CTGA 


ATTTAATTTA 


AGTGGCTTAG 


ATCCAGATCA 


ATATCCTTTA 


TTAC CTCAAG 


780 


25 


TTTCTAG AG A 


TGACGCAATT 


CAATTGTCGG 


TAAAAGTGCT 


TAAAAACGTG 


ATTGCACAAA 


840 




CAAATTTTGC 


AGTGTCCAcC 


TCAGAAACAC 


GCCCAGTACT 


AACTGGTGTG 


AACTGGCTTA 


900 




TACAAGAAAA 


TGAATTAATA 


TGCACAGCGA 


CTGACTCACA 


CCGCTTGGCT 


GTAAGAAAGT 


960 


30 


TGCAGTTAGA 


AGATGTTTCT 


GAAAACAAAA 


ATGTCATCAT 


TCCAGGTAAG 


GCTTTAGCTG 


1020 




AATTAAATAA 


AATTATGTCT 


GACAATGAAG 


AAGACATTGA 


TATCTTCTTT 


GCTTGAAACC 


10 80 


35 


AAGTTTTATT 


TAAAGTTGGA 


AATGTGAACT 


TTATTTCTCG 


ATTATTAGAA 


GGACATTATC 


114U 


CTGATACAAC 


ACGTTTATTC 


CCTGAAAACT 


ATGAAATTAA ATTAAGTATA 


GACAATGGGG 






. AGTTTTATCA 


TGCGATTGAT 


CGTGCCTCTT 


TATTAGCGCG 


TGAAGGTGGT 


AATAACGTTA 


X<£ O w 


40 


TTAAATTAAG 


TACAGGTGAT 


GACGTTGTTG 


AATTGTCTTC 


TACATCACCA 


GAAATTGGTA 






CTGTAAAAGA 


AGAAGTTGAT 


GCAAACGATG 


TTGAAGGTGG 


TAGCCTGAAA 


ATTTCATTCA 


lion 




ACT CTAAATA 


TATGATGGAT 


GCTTTAAAAR 


CAATCGATAA 


TGATGAGGTT 


unnut X IVjnn X 


144 0 


45 


TCTTCGGTAC 


AATGAAACCA 


TTTATTCTAA 


AACCAAAAGG 


TGACGACTCG 


GTAACGCAAT 


1500 




TAATTTTACC 


AATCAGAACT 


TACTAAAAAT 


AAATATAAAT 


AAAGGATGAC 


GTGATTAATT 


1560 




AAAACGTCAT 


CCTTTATTTT 


TTGGCAAAAA 


TAATTCTAGG 


TGCGTATGTA 


AAATAAATTT 


1620 


50 


GGCAGCATTT 


TAAACAGCAA 


ATAAAAGACG 


CCAATTAAAT 


TTATGACAAA 


TGTATCCAAA 


1680 




ATTTAATAAG 


TGTGCTTATA 


TGCCCTTTAA 


ATTTAAAATT 


TTAATAGTCA 


ATAACAAGTT 


1740 
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AAAAATAAGA ATTAATTATT TATATGTAAA CGGTTTCTAC CTCTATTTTA AATGAAATTT 1860 

GTGACAAAAA AAGGTATAAT ATATTAATGA CATACAAAGA AATGGAGTGA TTATTTTGGT 1920 

TCAAGAAGTT GTAGTAGAAG GAGACATTAA TTTAGGTCAA TTTCTAAAAA CAGAAGGGAT 1980 

TATTGAATCT GGTGGTCAAG CAAAATGGTT CTTGCAAGAC GTTGAAGTAT TAATTAATGG 2040 

AGTGCGTGAA ACACGTCGCG GTAAAAAGTT AGAACATCAA GATCGTATAG ATATCCCAGA 2100 

ATTACCTGAA GATGCTGGTT CTTTCTTAAT CATTCATCAA GGTGAACAAT GAAGTTAAAT 2160 

ACACTCCAAT TAGAAAATTA TCGTAACTAT GATGAGGTTA CGTTGAAATG TCATCCTGAC 2220 

GTGAATATCC TCATTGGAGA AAATGCACAA GGGAAAGACA AATTTACTTG GAATCAATTT 2280 

ATACCTTAGC TTTAGCAAAA AGTCATAGAA CGAGTAATGG ATAAGGGACT CCATACCGTT 2340 

TTAATGC 2347 
20 (2) INFORMATION FOR SEQ ID NO: 154: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13542 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
25 . (D) TOPOLOGY: linear 

ixi) SEQUENCE DESCRIPTION: SEQ ID NO: 154: 

ACAAGACGTn TCTATAACTT ATCTGAAATC GCTCGTCAAG ATAAAGATTA TGCAACTATC 60 

TCATTCTTAA ACTGGTTCTT AGATGAACAA GTCGAAGAAG AATCAATGTT TGAAACTCAC 120 

ATCAATTATT TAACTCGTAT CGGCGATGAC AGCAATGCAT TATATCTTTA CGAAAAAGAA 180 

CTTGGCGCTC GTACATTCGA CGAAGAATAA TTAAACATCA CTACAATAGA CAGATAAATA 240 

TCATACGACA TGAT AGG CAT TTGGGTCACT TACAATAACC CAATGTCTAT ATTATTTTGC 300 

TTTACGGAGA TCACTAGATT CATTTTCTGA ATCATTGATC TGCGTTTTTT CATTTTCAAG 360 

GCTAATTATT GTATTTTTAG TCATTTATTT TTTAAACTAC TAATGTTAAT AACTCTAAAT 420 

TTGATGTTGA ATTAATTTGA CGATTTTAAA GCATATCATC ATTTACTTTT TAATCAGAGT 4 80 

45 TACATCCAAA TGATAGATTT CACGTTATAC CTTCACGTAT AATATTATGT ATCGTTTGTA 54 0 

AGCAAATGAC TAAAAGTCTA TTAATATATA CATTTAATTA ATTGAAAGGA TTGACTACAT 600 

GATACAAGAT GCGTTTGTTG CACTTGATTT TGAAACAGCA AATGGTAAAC GTACAAGTAT 660 

SO TTGTTCTGTC GGAATGGTTA AAGTCATTGA TAGTCAAATA ACAGAAACAT TTCATACTCT 720 

TGTGAATCCG CAAGACTATT TTTCACAACA AAATATTAAA ATTCATGGCA TACAACCAGA 780 
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aGATTTACCT GTTGTCGCAC ATAACGCGGC ATTTGATATG AACGTCTTAC ATCAAAGCAT 
TCAAAATATT GGTTTACCAA CTCCAAATTT AACTTACTTT TGTAGTTATC AACTTGCTAA 
AAGAACCGTT GATTCGTATC GATACGGTTT AAAACATATG ATGGAGTTTT ATCAATTAGA 
TTTTCATGGT CATCATGATG CATTGAATGA TGCCAAAGCA TGCGCAATGA TTACTTTTAG 
GCTACTGAAA AATTATGAAA ATTTAACATA TGTAACTAAT ATTTATGGTA AAAATCTAAA 
AGATAAAGGC TAGGACTAAA TAAAATACTC CCTTCAAAAG TAAGCATTGT AAAAATGTAA 
ACTTTGCAGG GAGCTTTATT TTATATAAAG TCATATATCG TCATATTTTT ATAAGTTGAT 
TGTTCTAAAT TACCTACAGT GACACCAATA AGTCGAATTG GTACATCAGG GTCTTTTAAA 
TCGTTATAAA GTAAATATGC AATATTATAA ATATCTTCTT CAGAACTAAC CGAATCTCTT 
AAACTCATCT GTTTAGATAG CGTTTCAAAT TGATAAGTTT TAATTTTAAC CGTTACAGTT 
TTAGCTGACT TCTGTAATTT ATTTAGACGT TCAGCTGTTT TACCTGnACA ATTCCCATAC 
TTTTCTTAAA ATCTCTTCAT CATCATTCAC GTCTGTTGCA AATGTGCGTT CAGTCCCTAC 
TGATTTTCTT ACTCTTGATG ATTTCACTTC ACTATGGTCA ATACCGCGTG CCTTGTTATA 
TAAACCCCGA CCTCTTTTTC CAAACAAACG TATTAATTCA AATTCOGTTT TCTCATATAA 
ATCTCTACCG TTAAAAATAC CATTATCATG CATTACTTTT TTGGAAGCTT TACCTACGCC 
TGGaAAATCT CCAATATCCA ATGTCATCAA AATATCATGG - aCATTTTGAT AATCAATCAC 
AGTCATACCA TCAGGTTTAT TCATACCACT CGCTAATTTA GCTAAAAATT TGTTATAAGA 
AACACCTGCA GATGCTGTTA AATGTGTCTG CTCTAGAATA TCTTTTCTAA TATACTGAGC 
AATTTTCGAA GCAGGAAGGT CTGGTCTCAC TAATTCTGTA ATATCTAAAT ACGCTTCATC 
CAATGACATC GGTTCTACCT TATCTGTATA ACTTCGGAAA ATAGACATAA TCTGCGCAGA 
TGTTTCTCGG TAAGCACCAA AATTACTTGT GACAAAGTAT CCATTTGGAC ATAATTTATG 
CGCTTGTGAC ATAGGCATTG CTGAATGGAC GCCGTATTTT CGTGCTTCAT AGGATGCCGT 
AGAGACAACA CCCCTACTGC TTGCTTTACC ACCAACAATG ACTGGTTTCC CTTTCAATTT 
GGGGTTATCT CTCATTTCGA CTTGTGCAAA AAAATAGTCC ATATCTATAT GAATAATTCG 
TCTCTCAGTC AAGTGCTCAC CTCCCTACTA ATTTTTACTT TTATAACGCA CAAAAATATC 
TCAACATAAT TATACGCTGT GTACGATTTT TTTACATAAA TCTTGCACTT AGCGATAACT 
ATATTGaGAT AACTACAAGT TGTTATaAAA TCAATTGCTA TTTAAGCATG ATGATGAAGA 
CGATTGAGTA AGAAAACATA GGTAATCTGA AATAATTCAA GCAAATTCAT TTTGTTGGTA 
TCATCATATT AAAATTTATT ATTGAGTCGG CTTTTGATGA .TACAAATAAA TACTATCTTC 



900 
9S0 
1020 
1080 
1140 
1200 
1260 
1320 
1360 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
- 1980 
. 2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
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AAAGCAATAA GCGGTATGCA TACTAAACAT AAAAATAAGT GATGAATAAC CAAATACCTT 2700 

AATTAAAATA AGCAAGCCAG TACTTAATAG GATTAGTGGT GACAGCATAA TAATTGAGAA 2760 

TTGCCATTTG TTGAAGCAAG CATCTGCTGT TTGGAATAAG ATTCTGTCTT TTTTTATATT 2820 

AAACATAGGT TTGCTATCTT TTTTAAATAA AAGAAATAAT GCTCTATGGA TAAGTTCATG 2880 

TAAAATCAAT AAAATAATGA ATCCAGCAAA CCCATATACA AGATTGATGA TGATATTTTG 2940 

ATCGACAACC GCTGTGACAC CTAACGCCCA CTTATACGTA AATAAAATCA CGAATAACGC 3000 

AATAACAAGT TGCAAGATAA TAAACCTTCG CATTTGAAAA TTATTTGTCG TTAAATCAAT 3060 

TTTATGCATT ACCAACCCTC CCGATCATGA CATTCTTATT CTTCTTTAAA TATAGTATAC 3120 

AATGTCACAT TTAATTTAAA AAGTTCATAT CAAGAAAGTA AATTGGCTGT AATAAAATTT 3180 

TAATATACGA CTi ' L " I " lTCTT CACTTATTAA GGCGAAATTT TATCtCAAAT CATGTGCGCT 3240 

ATTTCAAATT GAATAATGCC ACTGTCTCAA CATGTGTTGT TTGTGGAAAC ATATCTACCG 3300 

GTGTTACCTC TTCAAGTTGA TATTTTTCAG CTAATAATAA TGCATCACGT TGCTGTGTTG 3360 

CGGGATTACA TGAAATATAG ACAATACGCT TAGGTTCTAA TGTAAGCAAA GTCTGAATAA 3420 

25 ACGTTTCGTC ACAGCCCTTT CTTGGCGGAT CAACCATTAC AACATCTGGT TTAATCCCTT 34 80 

GTGGTTTCCA TTGTAAAATA ACTTCTTCAG CTTTCCCACA GACAAAAGTT GTATTATTGC 3540 

ATTGGTTTAT AGTCGCATTT TGTTGTGCGT CTTCAATTGC AGAAGGTACT ACTTCAACAC 3 600 

30 < ; -t» ' , 

CGTATACATG TTTTGCAAGT GGTGCCAT AT ATAGCCCTAT TGTTCCAATA CCACAATAGG 3660 

TATCTAATAC AACTTCATTA CCTGTCAATT GCGCATACTC AATTGCTTTA TTATATAATT 3720 

TCTCTGTTTG TTCAGAATTA ATTTGGTAGA ATGACTGATC ACTTATTTTA AATGTACTAT 3780 

CTGTTAATTG ATCAATAATT GTATCTTTAC CATATAGCGT TATAGATTGA CGTCCGATAA 3 84 0 

TAACATTAGA GTGGCTATCA TTAATGTTTT GTTTAATGCT TGTCACATTA GGAAATGCAT 3900 

CTAATATCTT CTCAACAACA GCATTTTTTT GTGGCCACTT TTTACCATTA GTTACAAAAA 3960 

TAATCATCAT TTCGTCTGTA TGATATCCTG TTCTTACAAC CAAATGTCTC ATTAAACCTT 4 020 

TTTTCAATTG TTCTTGATAA ATACTTACAT TTAAATCTTT TAAAATAGAT TTAACTTCAT 4 080 

45 TCATCACTTC TTGATGTTGT GAATCTTGTA TTAAACAACT TTCCATGTCA ATAATGTCAT 4140 

GGCTTCTTTG ACGATAAAAG CCCATAATAA CTTCATTCTG TTCATTCTTA CCAACTGGAA 4200 

TCTGGGACTT GTTTCGATAT CTCCAAGGAT CTGTCATGCC AACTGTATCG TTAATCTTAG 4260 

60 AATTATCAAA ATGCGCTTTT CGCTGAAACA AATTAATCAC TTGTTCCTTT TTCATTTCAA 4320 

GTTGTGCTTC GTATGATAAG TGTTGAAGTT GGCACCCACC ACAACGTTCA TAATATATAC 4380 
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AGTTCTTTTT TACTTTGATA ATTTTATATT CAATTTGTTC ATTAATTAAA GCTTGTGGTA 4500 

TGAAAATAQG AAAGCGATCT ATTTTTACGA CACCATGGCC TTCATGCGTT AAATCAACAA 4560 

CTGTTCCCGT TTTTATGTCA TTTTTAGCTA TTGCTTGCAA AATTTTACCT CCAAAATGAA 4 620 

CAGGTTAGGA ACAAAATTAT GCGCTTCCTA ACCTGCCATT ATATATTTCA CTATTTCTGT 4680 

TTATTCTTCG ATTAAATTGT CATCAACATG ATCATTATTT ATTAACTCTT CATTTACAAT 4740 

ATCATTAGGT GCAAAGACAT CTATATGACG TTCTAGATTT , AAGAAATTCG CTGGTAATTT 4 8 0 0 

ACCACCATAT TCTCCATCTA CATTTAGTTG TAAGTCTGTG AATGATGAAA TATTAATTGC 4 860 

CTTTGCTTTT TCATAAATAA CTTTAGGATG CTTAGTATGT TCTCCTCTTG AAGCTAAAGT 4 920 

CATAATATG A CCAAGTTCTG CAAGGTTTGA TTTTTCAACT ATAATTAACG TAAAATAGCC 4980 

GTCATCTAAC TTAGCGTCGG GCACTAATTT TTCAAATCCT GCCATTGAAT TTGTTAAACC 50,40 

TAAAAAGAAT AATAATGCTT CTCCTTGGAA AACATTACCA TCATATTCAA TTCTTAAATC 5100 

TACAGCTTTC ATTTGAGGTA ACATTTCGAA ACCTTTGaTG TAATAAGCAA ATGGACCAAC 5160 

AATAGATTTC AATTTACTCG GTGTTTCATA AGAGACTTGC GTCAATTGTC CGCCTGCAGC 5220 

25 TAAATT AAT A AAGTATCGAT TATTCATTTT ACCAATATCT ACTTTAGTAG AATGACCTTC 52 80 

AATGATGACA TCAAGTGCCC CCATGATGTC ATTAGGTATA TGCAATGCAC GTCCAAAGTC 534 0 

ATTAACAGTA CCCATAGGAA TGACACCTAG CTTAGGACGA TTAGGCTTTT CTGCGATACC 54 00 

ATTAACTACT TCATTTAATG TTCCATCACC ACCTGCAGCG '. ATTAATACAT . CATAATTTTC 54 60. 

ATGCATAGCT CTTTCTGCTT CAAGTGTGGC ATCACCTATT TTCTCGGTTG CATATGCACT 5520 

CGTTTCATAT CCCGCTTTTT CTAATTTTAT TAAGGCATCA GGTAATT CTC TTTTAAATAG . 5580 

CTCTTTACCT GATGTCGGGT TATAAATGAT TCTAGCACGT TTCCTCATAT, CTTATCCCTC .5640 

TACTTAAAAT TCATATATTT TAACTTCATC TTTGTTTCGT CTAATAGGGA GTGGGACAGA 5700 

AATAATATTT AACAAAATTT ATTTCGTTCT ACCCCAACTT GCATTGTCTG TAGAATTTCC 5760 

TTTCGAAATT CTCTATGTTG GGGCCCCACC CCAACTTGCA CATTATTGtA AGcTGACAGA 5820 

AAGTCAGCTT CTTTGTTTGG GGGCCCCGCC AACTTGCACA TTATTGTAAG CTGACAGAAA 5880 

ATCAGCTTCT ATGTTGGGGC CCCACTAGAA TTGAAAAAAG CTTGTTACAA GCGTATTTTC 594 0 

TTTCAGTCAA CTACAGCCAA TATAACATTG TAGTGCCTAG GACATTGAAT TTATGACCCA 6000 

GGCTCAGTCT TATTTCATCA TTCTTAATAT CGTTAAAGAC CAACTTGTAT CTTAAACAAA .6060 

50 TACTATCTCA ATATGTACAA AGCTTGTTAT TTATTCAGCA TTTTTTGCCG TTCTTCATTA 6120 

TAtAGcTTCG TCAGTTATGC TATTTTACCT TTAAAATGAT GTTGTAAATA TAATGTTGTC 6180 
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AACGCATTAA TAAAATTAAT ATTTTTACCA TTAACATGTA CAATGAATAA AGTTAAAAGT €300 

AATTTGACTT CTATAGATAT AAATAAACCC TCGATTGCAT CTAAGTCAGC AATCAAGGGT €360 

TTATTTTTTA AATCTTCATA GTTTGATGAT TTAAATTATC TTTTATCTAA TTCTTGTTTT 6420 

AATAGTTGAT TTACTAATTG TGGATTAGCT TGACCTTTAG ACGCTTTCAT AATTTGACCA 64 80 

ACTAAGAAGC CCATAGCTTT GCCTTTACCA TTTTTGTAAT CTTCAACTGA TTGTTCGTTA 6540 

TTGTCTAATG CTTCATTTAC AAATTTTAGA AGTGTTGCTT CATCAGAAAT TTGAACTAAG 6600 

CCATTATCTT CCATAATCTG TTTAGCATTA CCACCTTTAG CTGCTAACTC TGGGAAGACT 6660 

TTCTTCGCAA TTTTACTGCT CATTGTTCCG TCTTCGATAA GTTTAATCAT ACCTGCTAAA 6720 

TTTTCTGGTG TTAATTTAGT ATCTAATAAT TCTACTTGAT TTTTATTTAA ATATTCGTTT 6780 

ACGCCACCCA TTAACCAGTT AGATGTTAAT TTAACATCTG CACCGTGTTC AATTGTTGAT 6840 

20 TCAAAGAAAT CTGACATTTC TTTAGTCAAT GTTAATACGT GTGCATCGTA TGCAGGTAAA 6900 

CCTAATTCAT TTACATACTT AGCTTTACGT TCATCTGGTA ATTCAGGAAT TGTCTGACGA 6960 

ACACGCTCTT TCCAAGCATC ATCAATATAT AAAGGTACAA TGTCAGGCTC TGGGAAGTAA 7020 

25 CGGTAATCAT CAGAACCTTC TTTAACACGC ATTAAAATTG TTTTACCTGT AG ATT CATCA 7080 

AATCGACGTG TTTCTTGTCC GATTTCTCCA CCATTTAACA ATTCTTCTTC TTGGCGTTTT 7140 

TCTTCATATT CTAAACCTTT ACGTACATAG TTAAATGAGT TTAAGTTTTT CAATTCGGCT 7200 

30 TTAGTACCAA ATTTTTCTTG ACCATATGGA CGTAAAGAGA TGTTAGCATC ACAACGTAAA 7260 

GATCCCTCTT CCATCTTAAC GTCTGATACA CCAGTGTATT GAATAATTGA ACGCAATTTT 7320 

TCTAAATATG CATATGCTTC TTTAGGTGAA CGAATATCTG G TTCAGAT AC GATTTCAATT 73 80 

AGOGGTGTAC CTTGACGGTT CAAGTCAAGT AATGAATACT CACCTTTATG TGTTGACTTA 744 0 

CCAGCATCTT CTTCCATGTG AAGACGAGTA ATACCGATTC GTTTTGTTTC ACCGTCGACT 7500 

TCGATATCGA TATATCCATT TTCACCAATT GGTTGATCAA ATTGAGAAAT TTGATATGCT 7560 

TTTGGATTAT CTGGATAGAA ATAG TTCTTA CGGTCAAACT TAGATTCTGT TGCGATTTCC 762 0 

ATATTTAGTG CCATTGCAGC ACGCATTGCC CAGTCTACTG CACGCTTATT AACAACTGGT 7680 

45 AAGACACCTG GATATGCTAA GTCGATAACA TTTGTATTTG AGTTAGGTTC TGCTCCAAAA 774 0 

TGCGCTGGTG ATGGAGAAAA CATTTTTGAG TCCGTTTTT A ACTCTACGTG AACTTCAAGT 7800 

CCTATAACTG TTTCAAAATG CATGATTTCC ACTCCTTATA ATTTTTCATA AACGTCATGT 7860 

50 AAATTGTATT GTGTTTCATA TTGATAAGCG ACACGATATA ACGTTTTTTC ATCGAATGGT 7920 

TTAC CAATG A AGTGTAAACC GATTGGTCGG C CATTTG ATT GTCCACAAGG AACAGAAAT A 7980 
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GGATCATCAA TTTCTTCACC TAAATTAAAC GCaGTgTnAG GCGCTGTTGG ACCAACTACT . 8100 

ACATCATAAT TTTCGAATAC TTTATCAAAG TCATTTTTAA TCAATGTTCT AACTTTTTGA 8160 

5 GATTTTTTAT AGTAAGGATC ATAGTAACCT GAACTTAATG CAAATGTACC TAAGAAAATA 8220 

CGACGTTTTA CTTCTTTACC GAAACCTTCA GATCTTGACA TTTTATATAA TTCTTCTAAT 8280 

GAATGAGCTT CTTTAGAATG ATAACCATAA CGAATTCCGT CAAAACGAGA AAGGTTTGAC 8340 

10 

GAAGCTTCTG ATGATGCAAT CACGTAATAT GATGGAATAC CAAATTTAGT ATTTGGCAAT 8400 

GATACTTCCT CAACGACAGC ACCTAAAGAT TTTAAAGTTT CTACAGCGTT TTGAACTGCT 8460 

?5 TCTTTTACGT CATCAGCTAC ACCTTCACCT AAGTATTCTT TAGGTAATGC AACTTTTAAT 8520 

CCTTTAATAT CTTTACCAAT TTCAGATGTA AAGTCTACAT CATCAACTGG TGCACTTGTA 8580 

GAGTCATTAA CATCTGCACC AGAAATAGCT TCTAATACGA TTGCATTATC TTTTACATTT 8640 

20 CGAGTCAATG GACCAATTTG GTCTAATGAA GATGCAAAAG CAACTAATCC AAATCGAGAT 8700 

ACACGACCGT ATGTTGGTTT CATACCGACA ACGCCACAAT ATGCAGCCGG TTGTCTAATT 8760 

GAACCACCTG TGTCTGAACC TAAGCTAAAT GGTACTAAGC CAGCTGCAAc TGCTGCTGCA 8820 

25 GATCCACCTG ATGAACCACC TGGCACTGCT TTATGGTCAA ATGGGTTAAC TGTTTTTTTG 8880 

AAATAAGATG TTTCTGTTGA ACCACCCATT GCAAACTCAT CCATATTTAA TTTACCGATT 894 0 

AAAACGGCAT TTTCATTATG TAGTTTTTCC ATTACAGTAG ATTCGTAAAT TGGCACAAAA 9000 

30 

CCTTCTAACA TTTTACTTGC ACATGTTGTT TCTAATGCGT- TTGTAATAAT ' GTTATCTTTT r 9060 

ATACCCATTG GAATACCAAA TAATTTGCCA TCCATTTGAT CTTTTGCTTG TAATTCATCC 912 0 

AATTCTTGCG CTTTTTTGAT TGCATTTTCT TTATCCAGCG CTAGAAAAGA CTTAATTGTT ' 9180 

35 

GGATCAGTCT CTTCAATTGC ATGATATATA TCTTTAACAA CATCAGATGG TTTGATTTTT ' ' 9240 

TTGTCTTTTA TTAAAGTTAA TAAATTCTCA ACCGATTCGT AGCGAATGCT CATCTTACGC . 9300 

GTCCTCCTCA TTCATGATTG TAGGCACTTT AAATTGTCCA TCTTCTGTTT CTTTGGCATT 9360 

40 

TTTCAAAGCT AATTCTTGTG GAATACCTTT AATTGCTTTA TCTTCACGTA AAACGTTTTG 9420 

TAAATCTAAA ACGTGATATG TAGGTTCAAC GCCTTCTGTA TCAGCGCTAT CATTTTGTTT 9480 

4S TGCAAAATCT AAAATGCTTT CTAATGTGTT GGCCATTTCT TCCGTTTCTT CAGGAGAAAT . 954 0 

TTGAAGTCTT GCAAGATTCG CGATATGCTC AACTTCTTCA CGTGTTACTT TTGTCATTAA 9600 

TAAAAGCCTC CTTTAAGTCA TTCATCACTA AATTGTATCA AATTTCCAAT TAAAAATCTA 9660 

SO AGTATTTATG AGGTGCTACT TTAATTTCAT ATAAACTGTA TAAACATTAT CATTCGTTTA 9720 

TCAAATCATT TTTTATGAAA ACAACACTCT TTTAATATTA GACAACCCAA TTCAATATTA 9780 
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TATATTGGTA TGCAAGTATT TCAAAAAGAA TAAATTTAAT TTTCCTACTT TTCTAAACAT 9900 
TTATCTTTAT GTATAATGTT TTCAAGTAAC TAAATTATAA ATTAAATAAA GGGAGTGTTT 9960 

5 ATCATGCTTA CAATGGGGAC AGCATTAAGT CAACAAGTAG ATGCCAATTG GCAAACTTAT 10020 

ATTATGATTG CCGTCTACTT CTTGATACTA ATCGTTATTG GCTTTTACGG TTACAAGCAA 10080 

GCAACTGGTA ACCTAAGCGA GTACATGTTA GGTGGAOGTA tATTGGACCG TATATTACTG 10140 

10 

CATTATCAGC TGGAGCTTCA GATATGAGTG GATGGATGAT TATGGGGCTA CCTGGTTCTG 10200 

TCTATAGCAC TGGTCTATCA GCTATGTGGA TTACAATCGG TTTAACATTA GGTGCTTATA 10260 

TAAATTACTT TGTTGTTGCT CCTAGACTTC GTGTTTATAC CGAATTAGCT GGAGATGCAA 10320 

15 

TTACATTACC AGATTTCTTT AAAAATCGTT TAAACGATAA AAATAATGTG TTAAAGATTA 10380 

TTTCTGGATT GATTATCGTA GTATTCTTTA CATTATATAC ACATTCTGGT TTCGTATCTG 10440 

20 GTGGTAAACT ATTTGAAAGT GCTTTTGGAT TAGATTATCA TTTOGGTTTA ATATTAGTTG 10500 

CTTTCATTGT CATTTTCTAT ACTTTCTTTG GTGGATATTT AGCTGTATCA ATTACAGATT 10560 

TCTTCCAAGG TGTCATTATG TTAATTGCGA TGGTTATGGT CCCTATTGTT GCTATGATGA 10620 

25 ATTTAAACGG CTGGGGAACG TTTCATGATG TAGCAGCTAT GAAACCTACA AATTTAAATT 10680 

TATTTAAAGG GTTATCATTT ATAGGAATTA TCTCTCTATT TTCATGGGGA TTAGGTTATT 10740 

TCGGTCAACC T CAT AT CATT GTAAGGTTTA TGTCTATTAA ATCACACAAG ATG CTACCTA 10800 

30 . AAGCTAGACG TTTAGGTATT AGCTGGATGG CTGTTGGTTT ATTAGGCGCT GTGGCTGTTG 10860 

GTTTAACAGG TATTGCATTC GTACCTGCTT AT CAT ATT AA ACTAGAAGAT CCTGAGACAT 10920 

TATTGATCGT GATGAGTCAA GTACTCTTCC AtCCTCTTGT AGGTGGTTTC TTACTTGCTG 10980 

35 

CGATTCTAGC TGCAATTATG AGCACGATTT CTTGACAATT ACTTGTAACA TCTAGTTCAC 11040 

TAACGGAAGA CTTTTATAAA TTAATTCGTG GTGAAGAAAA AGCTAAAACG CACCAAAAAG 11100 

AATTTGTTAT GATTGGAAGA TTATCTGTAT TAGTTGTAGC AATTGTTGCC ATCGCGATTG 1116 0 

40 

CATGGAATCC AAACGACACA ATTCTAAACT TAGTAGGTAA CGCTTGGGCC GGATTTGGTG 11220 

CATCGTTCAG TCCACTTGTG CTATTTGCAC TTTACTGGAA AGGTTTGACA CGTGCCGGTG 112 BO 

45 CTGTAAGTGG AATGGTTTCA GGTGCCTTAG TCGTTATCGT TTGGATTGCA TGGATTAAAC 11340 

CATTGGCACA TATCAAGGAA ATATTCGGCT TATATGAAAT TATTCCTGGA TTTATTGTAA 114 00 

GTGTAATCGT TACATATGTT GTAAGTAAAC TTACTAAAAA ACCTGGTGCA TTTGTTGAAA 11460 

50 CTGACTTAAA CAAAGTTCGT GACATCGTTA GAGAAAAATA ATTCATAAGT GTTAACAAAT 11520 

TAAAAAGGTA CTAATGTTAA TCAAAATTAT GACTAACATT GGTACCTTTT TATTATCTTT 115 BO 
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AATTAAAGCA 


CGTGGTTGGT 


TACCATCTTT 


AATACGAATT 


TCATAGTTAT 


CGATTTTATC 


11700 




GAAATATTTA 


TTCGCTTGTT 


CAGTAACGTA 


CTGTGTAATA 


CCAATTGTTT 


CAGCTTGTCC 


11760 


5 


ATAGTAATCG 


ATTGGTAAAT 


CTACTACTAA 


TCGTTGTGGC 


TTTTTATCAA 


CAAATTTAAC 


11820 




TTTCCCTACT 


GCTTGTGTGA AATTAGAAAA ATATGATTGC AAATTATCAT. 


TAAATTGCTT 


11860 


10 


GAAATTATTA 


TTTAAATTTT 


CATCATAATC 


TGCTGCTGTT 


GAAGAAGGTA 


ATAAAGCTGA 


11940 


TTTTTCATTG 


ATATTATGCC 


ATTCATTAAG 


CTTTGTTTGA 


CTCTTTTCTG 


CAGTCGCTTG 


12000 




AGTGATAAAT 


TCACCTGGTG 


TGATTGAATC 


TTCACTTGAT 


TGCTTATAAA 


TTGCAAAATG 


12060 


15 


AATTGGTATA 


TCTTTTAAAT 


CATCATTTTC 


ACGTAACCTT 


GATAATATCT 


CACTAGCCAT 


12120 


TTGTTTACCT 


TGCTTTTTAA 


CTcGCTATCA 


TCTAGTTTTT 


TACTAAAAGT 


CGATCCATCT 


12180 




TTTTCTTTTT 


TATAGTAATA 


AACACTATTC 


ATAGCTAAAC 


CAATCGTCAT 


ACCTTTAATA 


12240 




TTCTTACCTT 


TTGTATCTCC 


ACCACCATAA 


AAATCTTGCT 


CTAAAATGTT 


AGATAAATAG . 


12300 




GCTGGTGATT 


TTTCTGCAAT 


CTTTTCAGGA 


TCTGTTTCAC 


■ CTtCGTGTGA 


TGGATTAAGT 


12360 




CCTAAATTTT 


CATTCGCTTT 


CTTGTCTTTT 


TTATCTTTTT 


CAGACATTTT 


ATCGATTTCA 


12420 


25 


CGTTTTGTAT 


ACTTAGGATT 


TAAATAGGCA 


TTAATTGTTT 


TCTTGTCCAA 


AAATTGACCA 


12480 




TCTTGATACA 


AATATTTATC 


TGTTGGAAAT 


ACTTCTTTAC 


TTAAGTTCAA 


TAAACCATCT 


12540 




TCAAAGTCGC 


CGCCATTATA 


ACTATTTGCC 


ATGTTATCTT 


GTAAAAGTCC 


TCTTGCCTGG . 


12600 


30 


CTTTCTTTAA 


ATGGTAACAA .TGTACGATAG 


TTATCACCTT 


GTACATTTTT. 


.ATCCGTTGCA ... - 


.12660 




ATTTCTTTTA 


CTTGATTTGA 


ACTATTGTTA 


TGTTTTTGAT 


TATCTTTTCC 


AGCCTGGTCA ~ 


12720 




TCCTTATGGT 


TACCACAAGC 


AGCGAGTATA 


AAGATAGCTG 


TAATCAATAA 


TACTAATGTA 


12780 


35 


CGCTTCATCG 


ACATACCCCT 


CTAACTATTT 


AATTCATTTT 


-GCTTATCTAC. 


AAATTGTTGC , 


12840 




TCTGTCCAAA 


TTTCAATACC 


TAAACTTTGT 


GCTTTTGTTA 


ATTTTGAACC 


TGCATCTTCA 


12900 


40 


CCAGCAATAA 


CGACATCTGT 


ATTTTTAGTA 


ACGCTACTTG 


TAACTTTAGC 


ACCTTGTGAT 


12960 


GCAAGCCATT 


TAGATGCTTC 


ATTGCGTGTC 


ATTTGATGTA 


GCTTACCAGT 


CAGTACTATC 


13020 




GTTTTACCAC 


TAAATTCAGG 


ATGTCCTTCA ATATCTGATG 


TTTTGATACC 


TTTATAAATC , 


13080 


45 


ATATTAACAT 


GTTTATCTTT 


TAATTTTTGA ATTAAAGCAC 


GAATATCTTC 


•n 1 1 1 1L A f\t\r\ 


i An 

X J X*±\J 




TAAGTAACTA 


CAGATTGTGC 


TACTTTATCA 


CCTATATCAT 


GAATTTCTAC 


TAATTCCGCT 


13200 




TCAGTTACCG 


TTAGTAATCG 


ATCTATCGTT 


TCATATTTTT 


CTGCTAACAC 


TTGGCTCGCT . 


13260 


SO 


TTAACACCTA 


AATGC CTAAT 


ACCTAGACCA 


AATAATAAAT 


TTTCTAAAGA 


GTTGTCCTTA 


13320 




GCTTGTTGAA 


TGGCAGCTAA 


TAAATTATCA 


ACTTTTTTCT 


GCCCCATTCT 


GTCTAAAGGT 


13380 
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TAAAGCTGTT GAATAATTTT AGTGCCTAAA CCATCAATAT TcATGGCTTG TCTTGa TACA 13500 
AAGTGnATCa ATCCtTcAAC AAGTTGTGCT TGGTCATTTT GG 13542 
5 (2) INFORMATION FOR SEQ ID NO: 155: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1893 base pairs 

(B) TYPE : nucleic acid 

10 (C) STRAND EDNESS : double. 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 155: 





CAGTAAACAC 


CTCTGATTAC 


GAATATTTAT 


ACATTTATTT 


TAACACATGC 


ACTGATTTAL. 


b u 




GACTACTAAA 


CACCTTTACG 


TAAAAAGGGT 


AAACATGGTT 


TATCTATCTT 


GGTTATCTAT 


120 


20 


TTATAAATAT 


TTnTCATATT 


ACGCATAACA 


ATTGCTTAAA 


ATATGTATAA 


IV * IV • IV * A TkTTlT 

AAATGAATAT 


i on 




ATGTGTAATA 


AACTTGCTAA 


TTATTAGATT 


TAATAAGCGT 


CAATTGTTTG 


AACATAx 1CA 






ATTAAAATCA 


CATTGATATC 


ACAGATACGA 




AiAUAAAi lui 


AttMft 1 X l» X#lX 


inn 




TTTTTAAATG 


AAAGTCTTCA 


ACATAATTTT 


AAGTTTCAAC 


•jv TV" 1 T\ TV 7A B. TA 7\ 


»ppp TV TT it ji ^jv 


-5CA 

J o w 




AACAACGTCA 


GTTGAATATG 


CCTTTTGAGA 


* ■ r " i w i A K TV Z*" 1 


'I" l"l'7Af & MTTl 
X X Xnl— nnX j.o 


T**TY3r* r r a ATPf^ 

X lu^liinl vv 


420 




ATATATTTGC 


TTTTAGTGAT 


CCCTGCTATA 


/uvil/vvil 




niivtVJivJi X X 


480 


30 


' TGTATTGAAT 


TGTTCATCAA 


TTTGCGTTAG 


TTCATCCACT 


GCTGCGTCTC 


TATGATAAGT 


54 0 




CAATTTATCT 


TCTGCGCCAT 


CTTTCCCTAA 


TAAACTCACG 


TACGTACTTT 


TATTATTTTC 


600 


35 


AAGATOGCTG 


CCCACTTTTT 


TACCTAACTT 


TGCTTCATCA 


CCATAGCAGT 


CTAATAAATC 


660 


ATCTTTAATC 


TGGAACATCA TACCTAAATG 


ATAACTATAA 


CTTTCTAAAT 


GTTCTTTAGT 


720 




TGTA^T CAT CG ACATTAGCGA TATCTG CTGC 


ACTCATAACC 


GCAAAAGTTA 


ATAATGCTCC 


780 


40 


TGTTTTTGTT 


TTGTGTATCA 


TTTCCAAAGT 


TTCAAGATCA 


ATTGGTTGGC 


CTTCGCTTTG 


84 0 


CATATCTAAC 


ATTTGACCGC 


CGACCATTCC 


AACATGACCA 


CTTGCTATTG 


ACAGCCGTTG 


900 




TAGAACTTTT 


ATTTTTACTT 


CATCAGTTAA 


TCTATCATCA 


CTTGAAATAA 


- GTTCAAATGC 


960 


45 


TTTAGTTAAT 


AAAGCATCAC 


CTGCTAATAT 


CGCAGTCCAC 


TGACCATATA 


CTTTATGATT 


1020 




TGTTAATTTT 


CCTCGTCGAT 


AATCATCATT 


ATCCATCGCT 


GGTAGGTCAT 


CATGAATAAG 


1080 




TGAATATGTA 


TGAATCATTT 


CTAGTGCAAT 


TGCGCTCTTC 


ATACCTAACT 


CATACTCGGT 


1140 


SO 


ATTTAGTGAA 


TCTAAAGTGA 


GTAATAACAG 


AACTGGTCGG 


ATGCGTTTAC 


CTCCAGCATT 


1200 




TAATGAATAC 


AACATACTTT 


CTTCTAGCTG 


AGTATCCATT 


ACTGATTTAT 


TTATCGCAAC 


1260 
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CATCCTCAGC TTCTTCTTTT ATTAAGTCAT TCACCTTTTT TTCGGCATTT TTTAAAGTTG 13B0 

TGTCACAAGC TGCTGATAGT TTCATACCAC GTTGATATAA ATCTAATGAT TC CTCTAAAG 1440 

5 ATACTGTTTC ATTATCTAAT TTTTGAACAA TTTGCTCTAA TTCTTGCATC ATTTCTTCAA 1500 

AACTTTGCGT TTCTTTAGTC ATTATTACAC CTTACTTTCG TAACTTTTGC ATCTACTAAG 1560 

CCATCTTTCA TTGTTAACGT CAATTGATCA TTTTCTGTTA AATCTTTAGT ACTCGTAATG 1620 

10 

ACTTCGTCTT TTTTATTAAC AATTGCATAT CCACGCAACA TTGTATTAGT TGGACTTAAA 168 0 

TTGTTTAAGT TTTCTACTTT ATTTTTCAAA TCATTTTTAT AACTTAATAT CTTAGAATTC 174 0 

^ AATAATTTAA CAAGTTGGTT TGTCAATTGA AGATTATnTT GTTGTTCTTG ATTAACACTA 1800 

CTTAGTAATG CTTTTAAATn ATAACGTTGG TGCAACAGCA TTAAATCGAG GCCCCGGTGG 1860 

TCCAAAGTTG CCCGAATTnG TGGTTTCAGG CCC 1893 

20 (2) INFORMATION FOR SEQ ID NO: 156: 

(i) SEQUENCE CHARACTERISTICS: . ( 

(A) LENGTH: 821 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
25 (D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 156: 



35 



40 



45 



50 



AAAATATATT 


CCTTCACTTA 


ATATTCAATT 


AGAGAAAAAC 


. ATGGTGATTG 


TAATATGTTG. 


. , 60 


TGCAATATTT 


CTGGGTGTTT 


TAATACTTTT 


TTTATTTCTG 


AATCGTAAGC 


TAAGGTTGGA . 


120 


AATTTATAAT 


AATAACTCTA 


GTAAAGGGAA 


AATAATTTTA 


TTTCCTTCAT 


TAAAAAACTT- 


. 180 


TTGTTTCACA 


ATATTTTATT 


ATTTTTTATT 


TGGCGGTCTT 


TCAATAATGG CTCTAAGTAT, , 


240 


GTTATTAACT 


TTAAATCCTC 


AAAATATAAT 


AGGCTTTATT 


GGTTGGTTGG 


TAATGACTGC 


300 


AGGTTTCTTT 


CTGTTAAACA 


TGTCATCGAT 


TATTGACAAA 


AAAATTTATG 


TATTATCTAA 


. 360 


AACTAACACG 


GTGGAAAAAT 


GATGGTTTAG 


CTGGATTTAC 


TGCAGGTTCT 


ATTTCGGCAA 


420 


TACTTGTATA 


TTGGACCAAT 


CAAAAAAATG 


AATTTGGAAT 


AAAAGATAAA 


AACGATTGGA 


480 


TAGGACATAA 


ACTAGACGTT 


GGTATAGATG 


CTGTAGAAAA 


ATCTGCAGAA 


AAAACAGTAG 


540 


ATGGTGTTGA 


AAATGTCATG 


GTGAAGCTTC 


AAAAAGTATT 


TCTAATCATA 


TAAGCCCTAA 


600 


GAAATGGAGC 


TGGTAAATGT 


TGCTATGCGA 


ATCTAAAATC 


ATCAATAAAA 


ACCCAAAATA . 


660 


TAGAATTATT 


AAATATAATG 


ATGAATACTT 


AATGGTCGAT 


ATAATAAGCA 


CTTGGATTAG 


720 


TTTATTITIT 


CCTTTTATTA 


ATTGGTTCAT 


CCCaAAAGaA 


TACGTCAAAA 


TTAGTAGAGA 


780 
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(2) INFORMATION FOR SEQ ID NO:'lS7: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2343 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 157: 





AGTAAGATAA 


TTTTCAATTA 






CTCTATTTAT 


ACAATACTTC 


60 


1S 


GTATTGAATG 


GcTTCGCTTT 






TTGGTCTTCG 


ACTGGCACTG 


120 




CTCCCTCAGG 


AGTCTCGCCA 


T1AA1AL 1AL 


ftT ATT 21 A PAT 


GTAATTTTAC 


TTTGAAATAC 


180 




TTTTAAAAAA 


TAAGACACTT 


TGCCCAACTT 


/** P & P ATA A AT 


GTAAAATTCA 


ATAAAATGAA 


240 


20 


TTTTCTGTGT 


TGGGTCCCTT 


CTTATAATTT 


iv&taaatapp 


ACTAAACTAA 


ATTAACGAGG 


300 




TGCCTTATGT 


ATAAAAATTA 


TAACATGCCC 


P A & PT A P A PT 


AC CAAT AGAA 


ACTTCTGTTA 


360 




GAATCCCTCA 


AAATGATATT 


TCACGATATG 


TT1 A*TYS A A HT 


TGTTGAAACr 


ATACCTGATA 


420 


25 


GCGAATTCGA 


TGAATTCAGA 


CAT CATCGTG 


GCGCAACATC 


CTATCATCCA AAAATGATGT 


480 




TAAAAATCAT 


CTTATATGCA 


TATACTCAAT 


CTGTTTAATT 


ATGTTCAAAG 


CATTAAGGTA 


540 




ACAAGACAAT 


ATCTAAGATA 


TCAAAGATAG 


AAATTTTTTG 


ACGTTGTTGC 


TGATTGTAAA 


600 


30 


CATAACCATC 


AATTTCATAA 


TTAATAG CAT 


CAATACGATA 


AATGGTTAAG 


CGTACTGAAT 


660 




CTACAAAGCC 


ATTATTATAA 


AATTTAACTT 


CTACAGGTTG 


GGCATATTGT 


AGCGCCTCGT 


720 


35 


GTAGCCGAAT 


GTTTAGCTCA 


GCCAATTGAT 


CATCTGATAA 


TACAGGACGT 


GTAATTTTGT 


780 


TTTGGTCGAT 


AATGTATTGT 


TGAATCGTTT 


CGAATTGTTC 


GGGTAATGTT 


GCAAAAGGAG 


840 




CCO?ITTAAT CATGCCTCTT CCCATAGGTA 


TATTGTTATC 


TAGTAATTCT 


CTTGGAACGT 


900 


40 


TACGATAATC 


AGTTTCTTCT 


TCATAACTTG 


TCATCCTTAA 


TTCACCCCAA 


TCTGATAATT 


960 


ACATTATACG 


AACATGTGTT 


CTATTTTGCA 


ACAAAAATTT 


TGTGGaAGCA 


TAAACGCGTT 


1020 




AATAATTAAT GCTCGTGtAA GTAAAAAAGA GGGATTAATT AAAATCGAAT 


AATG aCATAT 


1080 


45 


CACaGCAAAT 


AGTTCTTTTA 


AAGTAGTTAA 


ATAGTTTTAG 


CTTTAAGGAA 


aTGATAAaTG 


1140 




ATTGTwAATT 


CTAGCTAAAA 


TTTAATAAAA TGAAAATAAG ACTAACATGG AGGGGTAAAA 


1200 




GTAATGACAA 


ATGGATATAT 


TGGTTCTTAC 


ACTAAAAAGA ATGGTAAAGG 


GATTTATCGT 


1260 


50 


TTTGAATTAA 


ACGAAAATCA 


GTCACGTATT 


GATTTATTAG 


AAACAGGATT 


TGAATTAGAA 


1320 




GCGTCTACAT 


ATTTGGTGCG 


T AATAATG AA 


GTTTTATATG 


GAATCAACAA 


AGAAGGAGAA 


1380 
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TGTTTGTCTT CAAAAGCTGG TACAGGTTGT TATGTATCGA TTTCAGAAGA TAAACGATAT 
TTATTTGAAG CGGTATATGG TGCTGGCATC ATACGTATGT ATGAATTAAA TACGCACACA 
GGTGAAATTA TACGTCTAAT TCAAGAACTT GCACATGATT TTCCAACAGG TACACATGAA 
AGACAAGATC ATCCACACGC ACATTATATT AATCAAACTC CAGATGGTAA GTACGTTGCA 
GTAACAGATT TAGGTGCTGA TCGTATCGTT ACTTATAAAT TTGATGACAA CGGGTTTGAA 
TTTTATAAAG AATCTTTATT TAAAGATAGT GATGGGACAA GACATATTGA ATTTCATGAT 
AATGGAAAAT TTGCTTATGT CGTACACGAA TTATCAAATA CTGTGAGTGT TGCAGAATAT 
AATGACGGTA AATTTGAAGA GCTCGAGCGT CATTTAACAA TTCCTGAAAA CTTTGATGGA 
GATACTAAAC TTGcAGCAGT GCGTTTATCT CATGaTCAAC AATTCTTATA TGTATCTAAT 
AGAGGGCATG ATAGCATTGC AATTTTTAAA GTTCTTGATA ATGGTCAACA CTTAGAACTA 
GTAACAaTTA CTGAAaGTGG TGGTCAATTC CCAAGAGATT TTAATATTGC CTCATCAGAT 
GACCyTTTAG TTTgTGCTCA kGaGCaAGGA GATTCAGTTG TAACTGTTTT CGAAAGAAAT 
AAAGAAACAG GTAAAATTAC GCTATGTGAT AACACTCGTG TAG CAT CTGA AGGTGTATGT 
GTCAXATTTT AATCTTTAAT TAATCATGAT AAAAAGAAAA CCATGTTTCC AAAAAATTTG 
TGTATACCTT GAAATTTATT GnTTTCCAGn ACATCAATTA TGGGAAGCAT GGnTTATTTT 
TGT 

(2) INFORMATION FOR SEQ ID NO: 158: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 4837 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 158: 
AAATTGCCAG TTGGTATCGC TTCTGGTGCA GTAGTCGAAG GTTTCTTCCA AGGTATCATT 
CCGATTGGCT ATATCGTTAT GATGGCAGTA TTGTTATACA AAATTACTGT TGAATCTGGA 
CAATTTTTAA CAATTCAAGA TAGTATTACA AATATTTCAC AAGACCAACG TATTCAAGTT 
TTACTTATTG GATTTGCATT CAACGCATTT TTAGAAGGTG CAGCAGGATT TGGTGTACCA. 
ATTGCAATTT GTGCACTTTT ATTAACACAA TTAGGATTTA ATCCATTAAA AGCTGCGATG 
TTATGTTTAG TCGCAAATGC AGCGTCTGGT GCTTTTGGTG CGATTGGTAT CCCTGTAGGT 
GTTGTAGAAA CGTTGAAATT ACCTGGAGAT GTTTCAGTAT TAGGTGTTTC TCAATCAGCA 
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GGTTTTAGAG GTGTTAAAGA AACATTACCA GCAATTTTAG TAGTTTCAAT CACTTATACA 54 0 

CTTACTCAAG GATTATTAAC TGTATTCAGT GGACCTGAAT TAGCAGATAT TATTCCACCG 600 

5 TTATTAACAA TGTTAGCATT AGCAGTATTT TCTAAAAAAT TCCAACCAAA ACACATTTAT 660 

CGTGTTAATA AAGATGAAGA AATTGAACCT GGAAAAGCAC ATTCTGCAAA AGCAGTATTA 720 

CATGCATGGA GCCCATTCAT TGTATTAACA GTCATTGTAA TGATTTGGAG TGCGCCATTC 780 

10 

TTTAAAAACT TATTCTTACC AAATGGTGCT TTATCATCAT TAGTATTTAA ATTCAACTTA 84 0 

CCTGGaACAA TCAGCGAAGT TACGCATAAA CCATTAGTAT TGACTTTAAA TATTATTGGA 900 

CAAACAGGTA CAGCTATTTT ATTAACTATT ATTATTACAA TTTTAATGTC TAAAAAGGTT 960 

15 

AACTTTAAAG ATGCAGGTAG ATTATTCGGC GTTACATTTA AAGAGTTGTG GTTACCAGTT 102 0 

CTTACAATTT GTTTCATCTT AGCAATTTCT AAAATCACAA CTTATGGTGG TTTAAGTGCA 1080 

GCAATGGGTC AAGGTATTGC TAAAGCAGGT AATGTCTTCC CAGTTCTATC ACCAATTTTA 1140 

20 

GGTTGGATAG GTGTGTTTAT GACAGGATCA GTTGTAAATA ACAACTCATT ATTTGCAGCA 1200 

ATTCAAGCTT CTGTTGCACA ACAAATTGGA ACAAGTGGTT CACTTCTTGT ATCTGCTAAT 1260 

25 ACAGTTGGTG GTGTAGCGGC AAAATTGATT TCACCACAAT CAATTGCAAT TGCAACTGCA 1320 

GCAGTAAAAC AAGTTGGTAA GGAATCAGAA TTATTAAAAA TGACATTGAA ATACAGTGTA 13 80 

TGTTTACTAA TATTCATCTG TATTTGGACT TTCATCTTGT CATTATTATA AAAAAACGTA 1440 

30 TTTCAAAATA TAAATATACA GAAGGTGAGA TGTTTTCTAA CATCTCATCT TTTTTTTATG 1500 

GATCATTAAT GAAAGAAGTT TGACATTATA ATAATGGTAG CGCTTTATGT TAAAATGAAT 1560 

AGTGAGTAAT CAGCAATCAA ATTAAATTGG TTGATAGCTG TTAAGGTTTG TGGTTTTGTC 1620 

35 

TTTGTGCTAT CG Cn CAT AAA GTATATAATT AAAGTAGTTT CGTTATTATA AAATATTAAT 1680 

ATACATAGTA GATAGTAATA GAGCATCACC ATGGGAACCT ATTGAGACAC TTATTGATTT 1740 

AAAGTGGTAT TAATATGTCG TATTTCTCGA ACGTTCCATT ATTCATTTTA AAAAGGGGGA 1B00 

40 

CTGTATTTGT TATGACAACA CAACATAGCA AAACAGATGT CATCTTAATT GGTGGCGGTA 1860 

TTATGAGTGC aCATTAGGAA CATTACTTAA AGAATTATCA CCTGAGAAAA ATATTAAAGT 1920 

GTTTGAAAAA TTAGCACAAC CTGGCGAAGA GAGTTCAAAT GTATGGAATA ATGCCGGTAC 1980 

45 - 

AGGGCATTCA GCACTTTGCG AGTTGAACTA TACAAAAGAA GGTAAGGATG GCACAGTTGA 2040 
TTGTAGTAAA GCAATTAAGA T AAATG AG CA GTACCAAATT TCAAAACAGT TTTGGGCATA J 2100 

50 TTTAGTTAAA ACAGGACAAT TAGATAACCC AGATCGCTTT ATTCAAGCGG TGCCACACAT 2160 

GAGTTTTGTC ATTGGCGAAG ATAATGTAGC TTTTATAAAA AGTCGTGTTG CAACGTTAAA 2220 
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GGTACCGTTA ATGATTGAAG 


GTCGTAAGTC 


TGATGAACCA 


. ATTGCTTTAA 


. CTTATGATGA 


234 0 




AACTGGTACa gATGTTAACT 


TTGGTGGGTT 


AACTGCAAAG 


TTATTTGATA 


ATTTAGAGCA 


2400 


5 


ACGTGGTGTG GGAATTCAAT 


ATAAGCAGAA 


TGTATTAGAC ATCAAGAAAC 


AGAAATCTGG 


2460 




GGTATGGCTA GTTAAAGTTA 


AAGATTTAGA 


AACTAATGAA 


ACGACAACAT 


ATGAATCTGA 


2520 


10 


TTTTGTATTT ATTGGTGCTG 


GCGGTGCGAG 


TTTACCATTA 


CTCCAAAAGA 


CTGGGATTAA 


25B0 


ACAATCAAAA CATATTGGTG 


GTTTCCCGGT 


AAGTGGATTA 


TTCCTGCGCT 


GTACAAATCA 


2640 




AGAAGTGATT GATCGTCATC 


ATGCTAAAGT 


GTACGGAAAA 


GCAGCAGTGG 


GTGCGCCACC 


2700 


15 


AATGTCAGTG CCG CACTTAG 


ATACACGTTT 


TGTAGACGGC 


AAGCGTTCAT 


TGTTATTTGG 


2760 




TCCATTTGCA GGTTTCTCAC 


CTAAATTTTT 


AAAAACAGGT 


TCACATATGG 


ATTTAATTAA 


2820 




ATCGGTTAAA CCAAATAATA 


TCGTGACGAT 


GTTATCTGCA 


GGTATCAAAG 


AAATGAGTCT 


2880 


20 


TACGAAGTAT TTAGTGTCAC 


AATTGATGTT 


ATCTAATGAT 


GAGCGTATGG 


ATGATTTAAG - 


2940 




AGTCTTTTTC CCAAATGCTA 


AAAATGAAGA 


TTGGGAAGTG 


ATTACAGCAG 


GGCAACGTGT 


3000 




CCAAGTAATC AAGGATACTG AGGATTCTAA AGGTAACTTA CAATTTGGTA 


CTGAAGTTAT 


3060 


25 


TACGTCAGAT GATGGCACAT 


TAGCTG CATT 


ACTTGGTGCA 


TCACCTGGTG 


CGTCAACAGC 


3120 




TGTAGATATT ATGTTTGATG 


TTTTACAGAG 


ATGCTATCGT 


GATGAATTCA 


AAGGATGGGA 


3180 




ACCAAAGATT AAAGAAATGG 


TGCCGTCATT 


TGGTTATCGC 


tTAACAGATC 


ATGAGGATTT 


3240 


30 


ATATCATAAA ATTAATGAAG 


AAGTAACTAA 


GTATTTACAA 


GTTAAATAAT 


AAACGAAACG 


3300 




GTAATGTCTT TTTTAATGTG 


ATAGACATTA 


CCGTTTTTTA 


GTGGTTAATA 


AAAATCATTT 


3360 


35 


TAATTGTTTC AGTTGCTTGT 


TAATAGTGTC 


TACGTAGTTC 


TTGTTTTTAA 


AGAATTGAAT 


3420 


TATCCAAATT AATACATAAA 


CCACAATGAA 


GATAATTGTG 


AATATGATTA 


GATAATGCAC - 


: 3480 




TGTTAGTGGA AACCAACCGG 


CAAGCATTGC 


TAAAGGCAAG 


AATCCGACAT 


ACGTTGTTAT 


354 0 


40 


GAAATGCATT ATAGTTG CTT 


TAGTAATGCT 


CCAATCTGTG 


TATTTAAAGA 


TAAAATCTCC 


3600 


AAGGAAAAAG ACGACG CCTA 


TGAGTAACCA 


TAAAATGATA 


GAAATCAACA 


TTACGGTAGT 


3660 




TTCTGTGAAA TGCGTATAAT 


ACAATATGCC 


AATAGTTGAT 


TGTGGGTTCA 


GTGGATAATA 


3720 


45 


TTTGCCGTCT GCAAATAACA 


TACTAAAGAA 


CAGTGAAAGG 


GACAAACCAA 




J / OU 




AATAAATAAT GAGTTTTTCA 


AATTTTTCAT 


ATTGATAAGC 


GCTCCTTTAT 


AGATTTTAAA 


3840 




TAACGTCTAG AAGAATAGGT 


GTAGTGTGCA 


TCTTTAAGAT 


ACATACGTAT 


AAGTCCATTT 


3900 


50 


GGCTCTAATA ATAATTTTTC 


AATGTAATAC 


TTGTTGACGA 


TTTCTGATTT 


GGAAATGCGA 


3960 




ATGAAATGTT GTGGTAACTG 


TTTTTCTAGT 


TCATAAAGTC 


GTAATTTTAG 


TTTGAATTTT 


4020 
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5 



20 



ACATTAATGA 


TATGGATTTC 


TTTGTCTATG 


TATCCGACTA 


ATGTATGTGA 


TTTGTCTAAA 


4140 


TCATTGACTG 


CATTAATAAT 


ACTTTGAACG 


TTATCATTCA 


TTTTAGGTGC 


ATGTATATCA 


4200 


ATATAAGATT 


CCGTCTCATT 


TGCATTGATA 


AATAAATTGA 


GTTTCATCAT 


AGGTTAATGC 


4260 


CTCCTTCAAA 


ATTATTAAAC 


CATAAATGAC 


CATCGATATA 


TTTAAATTTT 


GTTGAATGGT 


4320 


AGAAATTAAA 


TGTTAAGTGG 


CTAGAAAGCG 


CTAATCAATA 


TAAAAGATAC 


CTCCTGAAAT 


4380 


AAAAACAGAA 


ATGTTTTTTC 


AGGAGGTAGA 


GATTAAAGTG 


AATTATTTGG 


CAGTGTAATA 


4440 


GTAAAGGTGG 


TTACATACTC 


GTTACTTTGT 


GTGAATTGGA 


TTGTACCATG 


ATGCAATTCA 


4500 


ATGATGGATT 




AAGACCTAAA 


CCATTG CTAT 


TATCATGTTT 


GCTCACTTTA 


4560 


TAAAAACGTT 


CAAATAAACG 


TGCTTCAGCT 


TGTGGACTAA 


TTGGTGAACC 


ATCATTACTT 


4620 


ATTGTGAAAA 


TGATATTGTT 


GTGACTATGT 


TGCAAAGCGA TGTCAATGGC 


ACCACCAACA 


4680 


TCTGTATACT 


TAATAGCATT 


TATTAATAAA 


TTACTCAATG 


CTTGATGTAA 


CAAACGTTGA 


4740 


TTTCCTAGGA 


AATTGATGAT 


TCTAGGTCAG 


CTAAnATGAT 


TAACGACTTT 


TCATCAGCAG 


4800 


CAnATTGTTC 


ATGTCGAATG 


ATATCnTTAA 


TGAGCTG 






4837 



25 (2) INFORMATION FOR SEQ ID NO: 159: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1600 base pairs 
.(B) TYPE: nucleic acid 
(C) STRANDEDNESS : double 
* % (D) TOPOLOGY: linear 



^(Xi> SEQUENCE DESCRIPTION: SEQ ID NO: 159: 

35 

ACAATTATTG GATTATTATC AAGCAACGTT AATGGATGAC TTCCACTTAC AACAGAAATG 60 

CCCATAGATT CTAAATCTt T TGCATGAGCA TCTTGTGATA AGTCTTTTCC ATCATTGACA 120 

GTTACATTCG CACCTAATTT ACTTAATAAT TTAGCTGCTT CATAACCACT TTTTGCCAAA 180 

40 

CCGACAACTA ATACATTTTT ATTTTCTAAC CCTGTATAAT TAAGCATCTT AATGCACTCC 24 0 

AATCCATAAA CCGATTAAAC CTGAAATCAG ACCAACAGCC CAAAATACTG TAACTACTTT 300 

45 CCATTCGCTC CATC CTAT CA ATTCAAAATG ATGATGAATC GGACTCATTT TAAATATACG 3 60 

CTTTCCAGTC AATTTAAAGC TAGCGACTTG TAACATAACA GATAATGTTT CAATTACGAA 4 20 

TACTAAACCT ATAAAAATTA ATGATAATTC CTGATTAAGC ATGATTGAAA TGGTAGCAAA 4 80 

SO TATACCACCT AAAGCTAAGC TACCTGTATC TCCCATAAAC ACTTTAGCAG GGTTAATGTT 54 0 

ATATGGTAAA AATCCTAAAA GTGCAAACAA CATAATGATA CAGAAAATAC CAATTGCCGT 600 
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TGCTAATCCA TCTAAACCAT CTGTTAAATT TACTGCATTA GAAAAACCTA CTTGCCAAAA 720 

AACAATGAAA ATAACATATG CAAATGATAG TGGGATTGCT ACATTCGTAA ATGGAATATG 780 

5 

TATGCTCGTA GAAAAATTCA GCAAATGAAA CACATTACTT AAAACAAAGA ATATAATCGC , 84 0 

AATACCAATT TGCGCCAAAA ACTTCTGTTT AGTTGTTAAA CCTTGGTTAT TCTTTTTAAC * 900 

AACAATAATA TAATCATCTA TAAAACCAAT TAACCCAAAA CCAATCGTCA CAAATAATAA 960 

10 

CAGTATGATT GGATTAGCTT GATCTACAAA TATAATAGCC ACCAAAGACG TTATCACAAT .- . 102 0 

ACTTAATAGA AATGTTAGTC CACCCATCGT TGGTGTACCA GTCTTCTTCA TATGGCTTTG 1080 

\ TGGACCTTCT TCTCGAATAC TTTGACCAAA TTTCATCCTT TTTAATGTAG GTATTAAAAC 114 0 

AGGTACCAAA ACAAATGTAA TCACTAGCGC TAATAACGCA TATACAAAAA TCATAACTAT 1200 

CTCCTCTTCT TAATCCAGAC TTTTTTAACC ACTAATATAT TATCAATTTT TCAATTAAAT 1260 

20 AAACAAAGTT GTAATCAAAA TTTATAATTT TTCTTTTTTA CGG CAT AAG A GGCCAGTATA 1320 

AAAAGTTTGC CTATAACAAA CAAGTTAATC TGACCTCGTC TACCTTAAAA TTCTCTATCA 1380 

ACACTTATTT ATAAAGATTA AATGAAGATG TTGTTTTCTA TCACAGCATT ACTTTAGTAA 1440 

25 AAACAAATAG TGACAATACA TCCTAATTTA ATGTAGCCAT TCTTGTTAGT CCGACTTATC .1500 

CTTGTCAGTT TTACTGTCAG ATTTCnTCTT ATCATCTGAA TTTGAATCAG AATTATTCGT 1560 

CGAATTGCTG TCTACATTCT CTGGATGGAA AATTCTACGT . 1600 

30 

(2) INFORMATION FOR SEQ ID NO: 160: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1186 base pairs 

(B) TYPE: nucleic acid 
35 (C) STRANDEDNESS : double 

<D> TOPOLOGY: linear ^ . 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 160: 

40 

ATTGCCTTTG TTTTAATTTT AAATCAAAAT mGCCTATGAA AGATTTAAAT CAATTAATTT 60 

CTATAATATT ATCATTTTTA AAGCATATCA TTGTTTAGTT TTTTTATAAT TGGATAAATA 120 

45 CTAATAGTTA CTTTATAAAA CATTACATAG AGAAAGGTTA AGGAGTGCAC ATGTCGAAAA 180 

AGGATCACTC TTCTTCAAAA TACCTTAATT CTGTTAAGGA AGCGCAAGAG GAGTCAAAAA 240 

AGAAAAATAA AAGTAATCCC AAAATTGATG TTGATCGTAC ATATATTGAA CCTCAACAAT 3 00 

50 1 TCCAATCTAA GAAACCTAAA AAAGATGATC AGGTTTTCTT CTTATCAAGA TTAAATAAAC 360 

CTGCAAAATA TAAGAAAGAC TCTAATTTCT TATCATATCT CATCTATCGC ATAGGAAAAG -420 
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5 



10 



1S 



20 



TGTTGCTTTT 


CCTATTAACA 


TTATTACCAT 


TTTTCAATAT 


TAAGCAGAGT 


CAAATTACTA 


540 


ATATGTTAAG 


CAATGCACCC 


GCTGAAACAT 


CTACTCTAAT 


TAAGAGTGTA 


ATTGGTGATA 


600 


TAACTCAAAA 


CTCCAGTGGT 


GGCTTATTAT 


CTATCGGTTT 


GATTTTAGCA 


ATTTGGTCAG 


660 


CTTCAAATGG 


AATGACtGCA 


ATTATGAATT 


CTTTCAATGT 


TGCTTACGAT 


GTAGAAGATA 


720 


GCCGTAATGG 


AATCGTATTA 


AAACTACTAA 


GTGTTGTCTT 


CACTGTAGTT 


ATGGGCGTTG 


780 


TGTTTGTAGT 


TGCTCTAGCA 


TTACCAACGC 


TTGGTTCTGT 


AATTAGTCAT 


TTCCTATTCG 


840 


GTGCACTTGG 


aTTTGACGAA 


CAAGTGAAAT 


GGATTTTTAA 


CCTTATTAGA 


ATTGTGTTAC 


900 


CAATCATTAT 


TATATTTATC 


ATATTTATCG 


TGTTATATTC 


GGTTGCACCT AACGTTAAAA 


960 


CGAAGCTTAA 


GTCAGTA7TA 


CCAGGTGCAG 


TATTTACTTC 


AATTATTTGG 


TTAGCTGGTT 


1020 


CATTTGGTTT 


TGGTTGGTAT 


ATTTCAAATT 


TTGGTAACTA 


TTCTAAAACA 


TATGGCAGTA 


1080 


TGGCGGGTAT 


CATCATTTTG 


TTACTATGGT 


TATATATCAC 


AAGTTTTATT ATAATTGTCG 


1140 


GnGCTGAAAT 


CAATGCAATC 


ATTCATCAGC 


GTAGTGTAAT 


TAAAGG 




1186 



(2) INFORMATION FOR SEQ ID NO: 161: 

25 <i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7872 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 161: 
TCTTGAGCCA TCTTTTGAGC TAACTGACTA GATTGATACC CAAAAATCAT AGTTACCAAC 6 0 

35 

ATAAACTTTA ATTTTACCGA AGTCTAAATC AGCGATATGA GTACATACAT TATTTAAGAA 120 
ATGACGGTCA TG CG AT ACT A CGATAACAGT ATTATCAAAG TTAATTAAGA AATCTTCTAA 180 
CCAACTGATT GCTGGAATAT CGAGACCGTT AGTAGGCTCA TCCAGTAATA GTACGTCTGG 24 0 

40 

TTCACCGAAT AAACTTTGCG CTAATAATAC TTTAATTTTT TGGTTGTTTT CTAATTCAGC 3 00 

CATTTTTTTA TCGTGTAAAG TTGGATCGAT ACCTAAACCA GATAAAAGGT TAGCAGCATC 360 

45 AGCTTCAGCA TTCCAACCAT TCATTTCTGC AAATTCACCT TCAAGTTCAG CAGCACGGAT 420 

ACCATCTTCA TCACTGAAAT CTGGCTTCAT ATAGATTTCA TCTTTTTCTT TGATAACCTC 480 
ATAAAGACGT TCGTGACCTT TAATTACAAC ATCAAGCACG CGTTCATCTT CATAAGCATA 540 

50 GTGGTCCTGT TTTAAAACAG CTAGACGTTC ATTTTTCCCT AATGAAACAT GTCCTGTTTG 600 

AGAATCTAAT TCACCAGATA ATATTTTTAA GAATGTTGAT TTACCTGCAC CATTCGCACC 660 
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ATCTCCAAAA CGTAAACTCA CATCAGTTAC TTGTAACATG CATTTTCTCC TTTTTTTCAT 780 

TCGATATTCT AACGGAAGAA TTATATCATA TTATCGTCAC AGTTTCGACC TCATATAAGT 84 0 

TGTAATGATA GAATGACTGA CACATGTTAT AATAATAAAG AATACAAGAA TCGAAGGAGA 900 

ATAACATGGC ATTAGACAAA GATATAGTAG GTTCTATAGA ATTCCTTGAA GTAGTAGGGT 960 

TACAAGGTTC AACTTACCTT TTAAAAGGAC CAAACGGTGA AAACGTAAAG TTAAACCAAT 1020 

CAGAAATGAA CGATGATGAT GAATTAGAAG TAGGTGAAGA ATATAGTTTC TTCATTTATC 1080 

CAAACCGTTC AGGTGAATTA TTTGCAACTC AAAATATGCC TGATATTACG AAAGATAAAT 114 0 

ATGACTTTGC TAAAGTACTT AAAACGGATC GCGATGGGGC ACGTATAGAT GTTGGATTAC 1200 

CCCX3TGAAGT GTTAGTACCA TGGGAAGATT TACCAAAAGT GAAATCACTA TGGCCACAAC 1260 

CTGGTGATTA TTTGCTAGTT ACATTACGAA TTGACCGTGA GAATCATATG TATGGAGGTT 1320 

2Q TAGCGAGTGA ATCTGTTGTA GAAAATATGT TTACACCTGT ACACGACGAT AATTTAAAAA 13 80 

ACGAaGTCAT TGAAGCCAAA CCTTACCGCG TATTACGAAT TGGTAGCTTT TTATTAAGCG 144 0 

AATCAGGTTA CAAAATTTTC GTACATGAAT CAGAACGTAA AG CTGAACCA , AGATTAGGTG 1500 

25 AATCTGTTCA AGTTAGAATT ATCGGGCATA ATGATAAAGG TGAGTTAAAT GGTTCATTTT 1560 

TACCACTTGC ACATGAACGT TTAGACGATG ACGGCCAAGT CATCTTTGAT TTACTAGTTG 1620 

AATATGATGG TGAATTACCA TTCTGGGACA AATCAAGCCC TGAAGCGATT AAAGAAGTAT 1680 

TCAATATGAG TAAAGGTTCA TTCAAACGTG CAATCGGT CA CTTATATAAA CAGAAGATTA 174 0 

TTAATATAGA AACAGGTAAA ATCGCTTTAA CTAAAAAAGG TTGGAGTCGA ATGGACTCAA 1800 

AAGAATAATC ATTTTTACAC GTGTCGTAGG ATGCGTGTTT TTTTTATTCA ATATTAAATC 1860 
GGACAGATGA AGTAGTTTTT TAAACATTCC TTTCAAAGTA AAAAATTAAA " TAATTCAAAC ■ 1920 

GAATAGGCTG GGaCATTAAG TTCTTAGGCA ATGTAAAAAA GCTGATTTCT ATTAATTATT 1980 

TGATGGAAAT CAGCTTTTTT GATATGTATT TTATAATGTA CAGCTCGTTG AGCTGCTATT 2 040; 

TTCCTTATAT TAAGTGCCAT TAATACAAAA GCTAGCTCTG GTTTAACTTT ATTTATTCCT 2100 

CGAACTGACA TTCGAGTGAA aCCCAAAATA GCCTTCATAA ATCCAAAAAC AGGCTCTACA 2160 

TAAATTTTTC TATGACTATA GATTTTTTTC GTTTCTGGTT CAGAAAGCTT TTGaTTAATT 2220 

TGGGCTTTAA TGTATTTCAA AGTAAAATTA CATGTTAATA CGTAGTATTA ATGGCGAGAC . 2280 

TCCTGAGGGA GCAGTGCCAG TCGAAGACAG GGGCCCCAAC ACAGAAGcTG ACATATAGTC 2340 

50 AGCTTACAAC AATGTGCCGG TTGGGGTGGC TGAGACGGCA CCCTAGGAAG GGACCCGTCA 2400 

TCAAAAATTC TATTTATAGA ATTTTACAGT AATGTGACAG ACGGGCAAAG CGAAgCCATT 24 60 
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CTTACTGCTG 


TTTTTTTAGG 


GATTTATGTC 


CCAGCCATTT 


TTGTATTCAT 


ATTTAAATTT 


2580 




CGATAATTTT 


TCAGGAAGCA 


TTTTAATTTT 


ACTAATGAAG 


CAATATTTTT 


TAGATTAACA 


2640 


5 


AAAATTAATA TTTACATTTT 


CTTAACAATT 


TTTTATGTAA 


CATTTACAGT 


TTCTAAAAAT 


2700 




GAGGTTAATA 


ATTCAAGGTT 


AAGATAAAGA 


TGTAATCAAT 


ACAAATACTA 


TTTGTTGTTC 


2760 


10 


ATACAGGGAG 


GATATTTCAA 


TGAAAAAATG 


GCAATTTGTT 


GGTACTACAG 


CTTTAGGTGC 


2820 


AACACTATTA 


TTAGGTGCTT 


GtGGTGGCGG 


TAATGGTGGC 


AGTGGtAATA 


GTGATTTAAA 


2880 




AGGGGAAGCT 


AAAGGTGATG 


GCTCATCAAC 


AGTAGCACCA 


ATTGTGGAGA AATTAAATGA 


2940 


15 


AAAATGGGCT 


CAAGATCACT 


CGGATGCTAA 


AATCTCAGCA 


GGACAAGCTG 


GTACAGGTGC 


3000 




TGGTTTCCAA 


AAATTCATTG 


CAGGAGATAT 


CGACTTCGCT 


GATGCTTCTA GACCAATTAA 


3060 




AGATGAAGAG 


AAGCAAAAAT 


TACAAGATAA 


GAATATCAAA 


TACAAAGAAT 


TCAAAATTGC 


3120 


20 


GCAAGATGGT 


GTAACGGTTG 


CTGTAAATAA 


AGAAAATGAT 


TTTGTAGATG 


AATTAGACAA 


3180 




ACAGCAATTA 


AAAGCAATTT 


ATTCTGGAAA 


AGCTAAAACA 


TGGAAAGATG 


TTAATAGTAA 


3240 




ATGGCCAGAT 


AAAAAAATAA 


ATGCTGTATC 


ACCAAACTCA 


AGTCATGGTA 


CTTATGACTT 


3300 


25 


CTTTGAAAAT 


GAAGTAATGA 


ATAAAGAAGA 


TATTAAAGCA 


GAAAAAAATG 


CTGATACAAA 


3360 




TGCTATCGTT 


TCTTCTGTAA 


CGAAAAACAA 


AGAGGGAATC 


GGATACTTTG 


GATATAACTT 


3420 




CTACGTACAA 


AATAAAGATA 


AATTAAAAGA 


AGTTAAAATC 


AAAGATGAAA 


ATGGTAAAGC 


3480 


30 


AACAGAGCCT 


ACGAAAAAAA 


CAATTcAAGA 


TAACTCTTAT 


G CATT AAGT A 


GACCATTATT 


3540 




CATTTATGTA 


AATGAAAAAG 


CATTGAAAGA 


TAATAAAGTA 


ATGTCAGAAT 


TTATCAAATT 


3600 


35 


* CGTCTTAGAA 


GATAAAGGTA 


AAG CAGCTGA 


AGAAGCTGGA 


TATGTAGCAG 


CACCAGAGAA 


3660 


! AACATACAAA 


TCACAATTAG 


ATGATTTAAA 


AGCATTTATT 


GATAAAAATC 


AAAAATCAGA 


3720 




CGACAAGAAA 


TCTGATGATA 


AAAAGTCTGA 


AGACAAAAAA 


TAATAAGACG 


CAATTTCAAA 


3780 


40 


TGTGTCTTGA 


AACATGATTT 


TGATGGTGAA 


TCATTATTTA 


GAGTACAAAG 


CTTGATTTAT 


3840 




CGAGACGCTG 


ATTTTGACAT 


TCAGTTAGTC 


TAcAAGCTtA 


TCAACTTAAA 


ATAGTGGTTC 


3900 




ATCATTATTT 


TACAAATCTA 


ATTATTTTGG 


GAGTAATAGA 


AAGAGGTTTG 


ATTATGACTT 


3960 


45 


CATCTACTAA 


TGTTAAAGCT 


TTAATCGAAA 


AAAATAATAA 


TAAAAAAGGA 


AAGCATAATG 


4020 




ACAAAATTAT 


ACCAGTTATT 


TTAGCCGCAA 


TTTCAGCGAT 


TTCCATTTTA 


ACAACACTAG 


4080 




GTATATTAAT 


CACATTGCTT 


TTAGAAACCA 


TCACTTTTTT 


CACCAGAATT 


CCAATAACTG 


4140 


50 


AATTTCTATT 


TTCTACTACT 


TGGAATCCTA 


CCGGTTCAGA 


CCCTAAGTTT 


GGTATCTGGG 


4200 




CATTGATAAT 


AGGGACTTTA 


AAAATGACAG 


TTATTGCGAC 


TATATTTGCA 


GTTCCAGTCG 


4260 
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AACCGATATT 


AGAAATTTTA 


GCAGGAATAC 


CAACAATTGT GTTTGGTTTC 


TTTGCATTAA 


4380 




CCTTTGTTAC ACCAGTATTA AGATCTTTCA TACGAGGTCT TGGAGAGTTT AATGCTATAA 


4440 


5 


GTCCCGGCTT 


AGTTGTCGGT 


ATTATGATTG 


TCCCTCTCAT 


CACAAGTTTG 


AGTGAGGaTG 


4500 




CAATGGCATC 


TGTACCAAAT 


AAAATTCGAG 


AAGGTGCCTA 


TGGACTTGGA 


GCAACTAAAT 


4560 


10 


TAGAAGTAGC 


AACTAAAGTC 


GTACTTCCCG 


CAGCAACATC 


AGGTATTGTA 


GCTTCAATCG 


4620 


TTCTCGCGAT 


TTCAAGAGCA 


ATTGGAGAAA 


CGATGATTGT 


ATCATTAGCG 


GCAGGTAGTT 


4680 




CGCCAACAGC 


TTCATTAAGT 


TTAACAAGTT 


CGATTCAAAC AATGACTGGA 


TATATTGTTG 


4740 


IS 


AGATAGCGAC 


AGGTGATGCA 


ACATTTGGAT 


CAAATATTTA 


TTACAGTATT 


TATGCTGTAG 


4800 




GGTTCACACT ATTTATCTTT AC CTTAATCA TGAATTTACT 


TTCTCAGTGG 


ATTTCTAAGC 


4860 




GTTTTAGGGA 


GGAGTATTAA 


TATGGAAACG 


ACAGATAATA 


ATAGACAATC 


ACTCGTCGAT 


4920 




CAACAACTTG 


TCCAAAAACA 


TTTATCATCC 


AGAACGGTTA 


AAAATAAAGT 


GTTCAAACTC 


4980 




ATATTTTTAG 


CATGTACATT 


ATTAGGACTT 


GTCGTACTTA 


TTGCGTTGTT 


AACTCAAACA 


5040 




TTGATTAAAG 


GGGTAAGTCA 


TTTAAATTTA 


CAGTTTTTCA 


CTAATTTTTC 


TTCTTCAACA 


5100 


25 


CCATCTATGG 


CTGGCGTTAA 


AGGCGCGTTA 


ATCGGTTCAC 


TTTGGTTAAT 


GTTAAGTATC 


5160 




ATTCCATTAT 


CAATCATCCT 


AGGAATAGGT 


ACAGCTATAT ACTTAGAAGA 


atatgcgaaa' 


5220 




AACAACAAAT 


TTACTCAGTT 


TGTTAAAATC 


AGTATTTCCA 


ATTTAGCTGG 


TGTACCATCA 


5280 


30 


GTTGTATTTG 


GGTTATTAGG 


TTATACTTTG 


TTCGTTGQTG ' GTGCAGGGAT ' 


TGAAGCCTTG 


' 5340 




AAAATGGGTA 


ACAGTATATT 


GGCAGCAGCG 


CTAACAATGA 


CCTTACTGAT 


ATT AC CAATT 


5400 


35 


ATTATTGTTT 


CAAGTCAGGA 


AGCAATTAGA 


GCTGTACCTA 


ACTCAGTACG 


CGAACTTcTT 


5460 


ACGGCTTAGG 


TGCTAATAAA 


TGGCAAACGA 


TAAGACGTGT ; TGTCTTACCA * 


GCAGCGTTAC . 


* 5520 




CTGGTATTTT 


AACTGGATTC 


ATTTTGTCTG 


TTTCAAGAGC 


ACTGGGAGAA 


ACAGCGCCAC 


5580 


40 


TTGTG CTAAT 


CGGTATACCG 


ACTATATTAT 


TGGCAACACC 


TAGAAGTATA 


TTGGATCAAT 


5640 


TTTCAGCATT 


ACCTATCCAA 


ATATTTACTT 


GGGCGAAAAT 


GCCTCAAGAA 


GAATTCCAGA 


5700 




ATGTTGCATC 


GGCAGGCATT 


ATCGTTTTAC 


TAGTTATCTT 


AATCTTAATG 


AATGGCGTTG 


5760 


45 


CGATTATTTT 


ACGTAACAAA 


TTTAGTAAAA . 


AATTCTAATT 


TAAACAATCA 


ATCTCATTTA . 


5820 




TCTATTAAAA 


AGGGAGTTTT 


AAATATGGCG 


CAAACACTTG 


CACAAACTAA 


ACAAATATCT 


5880 




CAAAGTCATA 


CGTTTGATGT 


CTCACAAAGT 


CATCATAAAA 


CACCAGATGA 


TACAAACTCA 


5940 


50 


CATTCTGTTA 


TATATTCAAC 


ACAAAATTTA 


GACTTATGGT 


ATGGCGAAAA 


TCATG CATTA 


6000 




CAAAATATTA 


ATTTAGATAT 


TTATGAAAAC 


CAAATTACTG 


CCATTATAGG 


TCCATCTGGT 


6060 
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AAAACAGCTG GTAAAATATT ATATCGAGAT 
GAACAATTAC GTACAAATGT GGGCATGGTC 

5 ATATACGATA ATATTACTTA CGGTCCAAAG 

GATGAAATCG TTGAGAAATC ATTACGTGGC 
TtGCACACAA ATGCATATAG TTTATCCGGT 

10 TGTTTAGCAA TTGAACCTGA AGTCATTTTA 

ATCT CAACAT TAAGAGTAGA AGAGTTGGTT 
ATGGTtACAC ATAATATGCA ACAAGCAGCT 
AATGGTTATG TCAATGAATA TGATGATACT 
AAAACAGAAG ATTATATTTC AGGAAGGTTT 
CGATATCAGG AGCAACTTGA TGATTTAATA 

20 

TATGTGAGTA TTGaAAATGG TATAAAAt CA 
CAAACAGTTA AAAACGATAA ACATATCAAT 

25 ATCATGTTAA TTACAAAGCA ACAGCCCATT 

TTAAAAATCG CCTCCGATTT AGAAAGAATA 
CGATTG CGTA CAAAGATTAC AGATGATTAT 

30 TTAGGTATGT TAATGTTAAA GGACTTAGAT 

ATAAGAGAAA TAATTGAGCG TGATGAAGAT 

GCAACGTATC TTATTGATAA GGtCCATTTG 

35 

ATTTAGAACG TATTGGTGAT CATATTATTA 

CAGOTACACA TTACGAACAA TAACTTAAAG 

TATATTTCTA TTATTCATAA ACCCTCAAAA 

40 

AAATCTTGGT TTATATTGTT CTACTATAAA 
. AATTTCATCT GTTAATTTTT CAACTTCATC 
TTTAAGTGGC TGTTCTGTAG TAATGTCTAC 

45 

TACACTACCA CCTTTTTTCA ATGTTTCTAA 
TTTAATCTTT TGAGAAACGA GAGTTCCGAT 
50 TAATCCCATA TAGTAATGAG GTTGACGCAT 

TACTG CATCT CCAAAAAATT GTTTATAAAC 
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CAAGACATTT TTGATCAAAA ATATTCTAAA 6180 

TTTCAACAAC CTAATCCATT TCCAAAATCA 6240 

ATTCACGGTA TTAAAAATAA AAAAGTTCTT 6300 

GCTGCAATTT GGGATGAATT AAAGGATAGG 6360 

GGGCAACAAC AACGTGTTTG TATCGCGCGT 6420 

ATGGATGAAC CGACATCAGC ATTAGATCCA 6480 

CAAGAACTAA AAGAAAAGTA TACAATTATT 6540 

CGTGTATCAG ATAAAACTGC ATTTTTCTTA 6600 

GATAAAATTT TCTCTAACCC ATCAAACAAG 6660 

GGTTGATATA TAATGGCAAT AATTAGACAA 6720 

AAAGAATTAC GTCGGTTAGG TGCaAATGTC 6780 

TTAAGTATTG aCGATAGAGG CTTTGCACGA 6840 

CAATTAAATT ATGATATTAA TGAG CGAGTT 6900 

GCGAGTGATT TGCGTATGAT GATTTCTTCA 6960 

GGAGATAATG CCTCGAGTAT TGCCAATATT 7020 

GTGTTAACCC GTTTAAAGAC AATGGGTAAA 7080 

CAAGCATTTA AAAAGAAAGA TACCGTATTA 7140 

ATCGATGACT TATATAGTCA TATTATTAAC 7200 

TCG CTGCACA AGCTCATTTA GCAGCAAGAC 7260 

ACATCGCTGA AAGTGTTTAT TTTTATTTAA 7320 

TTATTACTAT AAAATCCCTT ACGATAAATA 73 80 

AAACCAAGAT TCTCACAATT AGTAATGTGA 7440 

TTGTCTCGCA TCTTAGTTAT TTGCTTGCTC 750 _? 

GACTAAATCA GAAATATATT GAATTGTAGA 7560 

AGCTGCAATG TTTGCAAGTT CGACAGGTGA 7620 

CCAAGCATCA ACAGCTGGTT GGCCTTCATT 7680 

TGTTAAGCCA GCAGAATACG TATACGAATA 7740 

CCATGTTAAT TCAGCACCCT CAGTCATGTC 7800 

ATTTAGCATT ATTTCATTTA ATGTnCGGCG 7860 
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(2) INFORMATION FOR" SEQ ID NO:'162: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH r 798 base pairs 

(B) TYPE: nucleic acid • 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 162: 
TTTTTTCTTT TCTTCATTTG AAAATTGATC ATTCAGCAAT ATAAGCGTAT TTGTTAATGA 
TTTAGGTGTT CCAATTTCAT AATCCCACCA ATTTAAGTTG GTATTCTTGC CAGTTGTTTT 
AGTAAAATTC TCACTTAATT CTTTTACTTT TTTATCTGGT TCTTTTCCAT ATGCATTTTT 
ATGCAGCCAC TCAAGGGCAT CTTTCACTTT CTTCTTATTT TCGTCAGTAT TTAAAGTGGT 
TTTAGGATTC CTCATCGCTT CTGCGATTTT CTCAATATTA CGATAGGTAC GAGTCATATG 
AGAAGAATTA GTTTCAAGGG TTTCCGCTCC TGACCACAAG TATTTCCTAC CACTTTCAGT 
TTTCATTTCC TTGAGTAAAT TOGTCGCCTC TTTCTCTGTA GCATCAAACT TCTTCTTCAT 
ATCTGGATTA TTCTCATCAT ACTTATCATA AC CATAGTT A ACGTCCAGCC ATGTGTTCCT 
CAATTTTTCA TAATCTGGCG TTTGAACATT CGTATCAGCC ACAGCGATTT GATGTTTATC 
AACACTTCTG AATTCACCAC CATTCAAAGT AATCACACCA GCCATTAATA ACGTAATGGT 
GGATAATTTT TGCCATTTCT TTATTCTATA TGTCATTGaC ATGTCTCCTT <■ TTTGTGTTGC 
GCGTGCGCAA TGAATATTAT GATTAAATAA TG ATTCAATT TTTCAAAATT CGTTAACGTA 
TACAAATGAC TGTCTACTGT CAAACAATCC ACAAAGAATG TTGATGtCAT ATaAACAATC 
GATCACCCAA ATTTTCCG 

(2) .INFORMATION FOR SEQ ID NO: 163: 

<i> SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 5132 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 163: 
TACAGGTTTT ACTATAATGG ATGGTATTTT GGCTAAACGA CATTGGTTTA GTCTTCTTTT 
TTTnACTTCC TAnATTTACA ATGGTATAAA TAATAATGCT ATATTTAGAA TGATGAGTAT 
ACTTACTGAA ACTAAATTAA AAGTGTCTGG TTCTTTACTA AAGATAGCTG CTATCCTTGC 
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10 



15 
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AATACAAGTT CCAATGAGCG CAATTAAAAG TACTAACCCA ACGATGAAAC TCTGTTTGTC 300 
ACTTAACTCA AAGAAACTAT AGATAGGATA TTTTTTAATA ATCAAGC CAC GTAAAATCAT 360 
CCATAAAAAT ACGATAATTC CATAAGTCAC ATTTATAACA TACGTTATTT TTTGGTCACC 420 
AAATCGGACT AATGTATTTG GTAGAATCAG CATACCAATG ACAACACCTA AAATAACGAT 4 80 

ACTAGCTATA TAAAGTAAAA ATGCAATTGT CACATCAAAT GTACCCAAAT CTAAAAACCT 540 
AGGAATTAyA AyGACTGCTA AAATAAAAGC GAAGyACAAA GTAATATAkT TATACAAACC 600 
GGTAGTAAGA CTTATCTCAG GTGATAATTG ATCAGCCATT GACTTAATCG GTGTATTAAT 660 
AATTGAACTT GTATCTTCGT TATTTTTTTC AGCCATAGTT AAATGATCTT CGAGCTCTTC 720 
CAATAACTCT TCTACTTCTG CTTCAGTCTT ACCTCTAAAT AACAATTCAA CACGTAATTT 780 
TTCTAAAAAA TCTTGAGATT GTTTACTTAA CATCGTTTTC CCCTCCAAAC AAGTTAATCA 840 
TCCCTTTATT GAAAACTTGC CATTTCGATT TAAATACTTT TAGTTCCTTT AAACCTGAAT 900 
CGGTAATCGT ATAGTATTTC CGCCTCGGGC CGCCATTACT AGATTTTTTT ATTGTCGTAT 960 

GAACGTATCC TTTTTTGTTT AAACGCATTA AAACTGGATA AATACTACCC TCACTTATCT 1020 

CTGGAAACTC TTGATTCTTA AGTTTCGTCA TAATTTCATA TCCATACGTT TCGCCTTGGG 1080 

CAATGAGACC TAATATCGCC CCATCTAAGA GACCTTTCAT AATCTGATCT GACACTGACA 1140 

* TTTT AAT CAC CTACT AT CTT ACATAATAAG ATAGTACATT GAGAACTTTT CGTCAACTAT 1200 

30 -. CTTTTATTGT AAGGTAGTTG TTGTACACAT TCCTTAAATG ACTAACAACT TTGTTAATAG 1260 

GGTAATACTT ACGGAAGTAT ATTTTATTTA TGGGGGAGGA ATTAATAATG ACTACAAAAA 1320 

;CAGTATTTGA TGTCATTGAT ATGGGGTTAG GATATTTAGT AAATGTGTAT GATGCTTGGA 1380 

AAGTTGAAAA GGTACTTGAT GATTATCATA AG C CTTTTTC TAATACCATT CATTGGCAAT 1440 

TTGGtCATGT ATTAACAATT TTTGAATCGG CCTTAGCTGT TGCTGGTAAA GAGAATATTG 1500 

ATTTAAATAT CT AT AG AC CT TTATTCGGAA ATGGTTCGTC TCCAGATGAA TGGAAGGATG 156 0 

AAGTACCGAG TATTGAAAGG ATTTTAGAAG GTCTCCAAAC TTTACCTGAA CGTGCACGAA 1620 

ATCTAACTGA AGATGATTTA GCAATTGAAT TGAAACAGCC AATTGTCGGT TGTAATAACT 1660 

TAGAAGAGTT ATTAGTATTA AATGCCATTC ACATCCCACT TCATGCTGGT AAAATTGAAG 174 0 

AGATGTCTCG TATATTAAAA AATTTAAAAT AAATATGTGC TTATTAACCG TTAACAACAC 1800 

GTTAACGGgT TTTTTATTTG TTTAAAAGGT CACTTTTTTG AATTTAATAA ACACCATCTA 1860 

TAC CAGTTCT TCACCGATTC TCGAAAAATA ATTATATTAA TGATTTCGTT AATTTAATTT 1920. 

TATATTTAAT TATTACTGTA CATCTTTTGT AGTTAGCTTT ATTCTTAAAT TGAAATATGT 1980 
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TACTCCCTAT CGTTGTAGGT CTCCTTATTT GGGCACTTAC ACCTTTTAAA CCGGATGCTG 
TGGATCCAAC AGCATGGTAT ATGTTCGCAA TATTCGTCGC GACAATCATT GCTTGTATTA 
CACAACCGAT GCCAATTGGG GCCGTCTCTA TAATTGGATT TACAATCATG GTACTCGTTG 
GCATTGTTGA CATGAAAACG GCTGTCGCTG GTTTTGGTAA TAATAGCATT TGGTTAATTG 
CTATGGCATT TTTCATTTCG AGAGGATTTG TGAAAACAGG TCTTGGTAGA CGTATCGCAC 
TTCATTTCGT CAAATTATTT GGTAAAAAAA CATTAGGATT AGCATATTCT ATCGTCGGTG 
TAGATTTAAT TCTAGCGCCT GCTACACCAA GTAATACCGC GCGTGCTGGT GGAATCATGT 



2100 
2160 
2220 
2280 
2340 
2400 
2460 

is TCCCAATTAT CAAATCACTT TCTGAATCAT TTGGTTCGAA ACCGAAAGAC GGATCAGCAC 2520 

GCAAAATGGG TGCATTTCTT GTTTTCACAG AATTCCAAGG TAATTTAATT ACTCCGGCTA 
TGTTTTTAAC TGCAATGGCC GGTAACCCCC TTGCACAAAA TTTAGCATCT AGCACATCTA 
20 ATGTTCACAT TACATGGATG AATTGGTTTC TAGCTG CTTT AGTTCCTGGA CTTGTTTCCT 

TAATTGTTGT ACCTTTTATT ATTTATAAAA TTTATCCACC AACTGTTAAA GAAACACCAA 
ATGCTAAGAG TTGGGCTGAA AATGAATTAG CGACTATGGG TAAAATCGCT TTAGCTGAAA 
25 AATTTATGAT TGGTATTTTT GTCGTTGCGT TAACACTATG GATTGTCGGA AGTTTCATTC 

ATATTGATGC AACTTTAACG GCCTTTATTG CGCTAgcATT gTTATTATTG ACAGGCGTCT 
TAACATGGCA AGACATTTTA AACGAAACAG GTGCTTGGAA CACATTAGTA TGGTTCTCAG 
TATTAGTGTT AATGGCCGAC CAATTAAACA AGCTTGGATT TATTCCTTGG TTAAGTAAAT 
CCATTGCTAC AAGTCTTGGT GGCTTAAGCT GGCCTATAGT CCTGGTCATT TTAATATTGT 
TCTACTTCTA TTCACATTAC TTATTTGCAA GTTCTACAGC ACATATCAGT GCGATGTATG 
CAGCATTACT AGgCGTTGCC ATCGCAGCCG GTGCACCACC ATTATTCAGT GCATTAATGT, 
TAGGTTTCTT CGGTAACCTA TTAGCTTCAA CAACACACTA TAGTAGTGGT CCAGCGCCGA 
40 TTCTATTCTC TTCAGGTTAC GTGACTCAAA AACGTTGGTG GACAATGAAC TTAATATTAG 3360 

GTTTCGTCTA CTTTATTATC TGGATTGGTT TAGGATCACT TTGGATGAAA GTAATTGGTA 3420 
TATTTTAAAA TATTTAAATT AGCGCTCGAA TCTCATTGAT TTGGGCGCTT TTTAATTTGT 
45 ATTTAAAATC AACCTTTGCT AAATCAAGAC TCCCTTTTTA AAATACGTTT ATCCTTTAAA 

TCATTGCGTG CTTCACTGAA AATTTGTATA AAGATTTAAG TCATTACGTA ACATCACATA 
AAATACATTT CTATACTATT CCGCTTCATT GATTAACATT ACGTATGCCC TCATAAATCA 
TCATACAAAA AACACCTTCG TTTAAATTCA TTTTAATTGC GAATTCAACG AAAGTGCCTT 
ATTTCATATT TAATGTTTCA AATTTATACG TCTGTCACTG TTACTGCACA CATACCTCAG 



2580 

2640 

2700 

2760 

2620 

28B0 

2940 

3000 

3060 

3120 

3180 

3240 

3300 



3480 
3540 
3600 
3660 
3720 
3780 
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TTATAGGGTT TTTGCGACCG GATGTTTCTT CAATTTAATG TATTGAGAAA GACTATATAA 3900 

CACAATACCT GTCCAAATAA ATATAAACGT AATTAATTGA TCTATACTAA AAGGCTCTTT 3960 

GAAAACAAAT ATGCCGAGTA CAAACATTAT TGTTGGTCCA ACGTATTGAA TAAATCCTAT 4020 

TAGCGAAAGT GGAATACGTT TTGCCCCGGC TGAGAATAGG ATTAGTGGTA TTGCCGTAAT 4080 

AGCACCAGAA AATAACAACC AAAATGATGA CATGTTCAAT CCAAATGACA TCTGATGTTG 414 0 
CTGCCATAAA TAAATAACGT ATATTAGTCC AGCAGGTGCG GTAACAATAC ATTCAATCGT ' 4200 

AATACTGCTG ATGGCATCAA TATGTACTAC TTTTTTCAAT AATCCGTATG TACCAAAGGA 4260 

TAACGCTAAT ATAATAGAGA CGATTGGGAA TTCTCCAATC TTGAGCGTCA TATATAATAC 4 320 

ACCGATGAAT GCGAATAAAA TGGCTAGCCA TTCAAATTTA TTGAATCTTT CTTTTAAAAA 4380 

GATAAGTGCG AGCAAAATGC TAACAAGTGG ATTTATATAA TAACCTAAAC TTGTTTGTAG 4440 

GACGTGACCG TTCGTTACAG CCCAAATAAA TGTACCCCAA TTTAATGTAA TGACATAGCC 4 500 

TGCTACGACA ATCGCTAATA GCTGAATGGG CTTGCCTAAC AATTGATTCA TATCTCGTTG 4560 

AAATGCATTG CGTTGTTTTT GTCCAACCGC GAGTATGAAA ATCATGAATA TTGCTGAAAA 4 620 

25 TATAATACGA AAGGCTAAAA TTTCAAATGC GCCTATTGCA TCAACGAACT GCCAATATAT 4 680 

AGGTAGTATT CCCCACAGAA TGTATGCACT GAGTGCTAAA AATATGCCTT TTTTATACTC 4740 

TGAATTCACC TTCAAACCTC CTTACTTTCC TAATTTTTAA TTTACTGCAT ACGCTCACTT 4 800 

30 GGTTATGCTA ATATAACGAT TTTACTAATA ATATTTCGAT AAAGATATCA TTTTGTTTAT 4 860 

ATTTCCCACA TTTATTCACC AACCACTAAA CAATATTAAT TTTATAAATA ATTCTGTACA 4 920 

AATCAGGGTA TATTGCCAGA AAGACTACCA TACAACATAA AGGATGGATA CAAATGACTT 4 980 

TACCTAAAAT TGGAAAGCCT GCAACACGCG CGCTAAATTC ACAAGGTATA TACAGATTAG 5 040 

AAGCAGTATC ACAATATACG AAGTCATCTC TAATGGAGAT GCATGGCGTT GGTCCTAAAG 5100 

CTATATCAAT ATTGGAACAA GCTTTATTTC AG 5132 
(2) INFORMATION FOR SEQ ID NO: 164: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 22243 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 
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60 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 164: 

AAGTAAATTA TATTATGAAT TTGCCTGTCA ATTTCTTAAA GACATTCTTA CCGGAACTAA 60 
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TAGAAGCAAT TAATAATGCy mAAGAAAAGA CAGCTAATAA TACCGGCTTA AAATTAATAT 180 

TTGCAATTAA TTATGGTGGC AGAGCAGAAC TTGTTCATAG TATTAAAAAT ATGTTTGACG 24 0 

AGCTTCATCA ACAAGGTTTA AATAGTGATA TCATAGATGA AACATATATA AACAATCATT 300 

TAATGACAAA AGACTATCCT GATCCAGAGT TGTTAATTCG TACTTCAGGA GAACAAAGAA 360 

TAAGTAATTT CTTGATTTGG CAAGTTTCGT ATAGTGAATT TATCTTTAAT CAAAAATTAT 420 

GGCCTGACTT TGACGAAGAT GAATTAATTA AATGTATAAA AATTTATCAG TCACGTCAAA 480 

GACGCTTTGG CGGATTGAGT GAGGAGTAGT ATAGTATGAA AGTTAGAACG CTGACAGCTA 54 0 

TTATTG CCTT AATCGTATTC TTGCCTATCT TGTTAAAAGG CGGCCTTGTG TTAATGATAT 600 

TTGCTAATAT ATTAGCATTG ATTGCATTAA AAGAATTGTT GAATATGAAT ATGATTAAAT 660 

TTGTTTCAGT TCCTGGTTTA ATTAGTGCAG TTGGTCTTAT CATCATTATG TTGCCACAAC 720 
20 ATGCAGGGCC ATGGGTACAA GTAATT CAAT TAAAAAGTTT AATTGCAATG AGCTTTATTG ' 780 

TATTAAGTTA TACTGTCTTA TCTAAAAACA GATTTAGTTT TATGGATGCT GCATTTTGCT 840 

TAATGTCTGT GGCTTATGTA GGCATTGGTT TTATGTTCTT TTATGAAACG AGATCAGAAG 900 

25 GATTACATTA CATATTATAT GCCTTTTTAA TTGTTTGGCT TACAGATACA GGGGCTTACT 960 

TGTTTGGTAA AATGATGGGT AAACATAAGC TTTGGCCAGT AATAAGTCCG AATAAAACAA 1020 

TCGAAGGATT CATAGGTGGC TTGTTCTGTA GTTTGATAGT ACCACTTGCA ATGTTATATT 1080 
TTGTAGATTT CAATATGAAT GTATGGATAT TACTTGGAGT " GACATTGATT TTAAGTTTAT * ' 114 0 

TTGGTCAATT AGGTGATTTA GTGGAATCAG GATTTAAGCG TCATTTCGGC GTTAAAGACT 1200 

CAGGTCGAAT ACTACCTGGA CACGGTGGTA TTTTAGACCG ATTTGACAGC TTTATGTTTG 1260 
TGTTACCATT ATTAAATATT TTATTAATAC AATCTTAATG CTGAGAACAA ATCAATAAAC - 1320 

GTAAAGAGGA GTTGCTGAGA TAATTTAATG AATCTCAGAA CTC CTTTTGA AAATTATACG 1380 

CAATATTAAC TTTGAAAATT ATACGCAATA TTAACTTTGA AAATTAGACG TTATATTTTG 144 0 

TGATTTGTCA GT AT CAT ATT ATAATG A CTT ATGTTACGTA TACAGCAATC ATTTTTAAAA 1500 

TAAAAGAAAT TTATAAACAA TCGAGGTGTA GCGAGTGAGC TATTTAGTTA CAATAATTGC 1560 

45 ATTTATTATT GTTTTTGGTG TACTAGTAAC TGTTCATGAA TATGGCCATA TGTTTTTTGC 1620 

GAAAAGAGCA GGCATTATGT GTCCAGAATT TGCGATCGGT ATGGGGCCAA AAATTTTTAG 1680 

TTTTAGAAAA AATGAAACAC TTTACACTAT TAGGTTATTG CCTGTTGGTG GATATGTTCG 1740 

50 TATGGCAGGA GATGGCTTAG AAGAGCCACC AGTCGAGCCC GGTATGAACG TTAAAATTAA 1800 

ACTTAATGAA GAAAATGAAA TAACACATAT CATATTAGAT GATCATCATA AGTTTCAACA 1860 
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CACTGCTTAT GATAATGAAA GACATCATTT TAAAATTGGT AGAAAGTCTT TCTTTGTTGA 1980 

AAATGGTAGC TTAGTTCAAA TTGCTCCGAG AGACAGACAA TTTGCACATA AAAAGCCATG 204 0 

5 GCCGAAATTT TTAACATTAT TTGCGGGACC GTTATTTAAC TTTATATTAG CTTTAGTCCT 2100 

ATTTATTGGT CTTGCATATT ATCaAGGcAC GCcTACGTCT ACTGTAGAAC AAGTCGCAGA 2160 

- TAAGTATCCA GCTCAACAAG CAGGATTACA AAAAGGTGAT AAGATCGTCC AAATTGGCAA 2220 

10 

ATATAAAATA TCTGAATTTG ATGATGTTGA TAAGGCGTTA GATAAAGTTA AAGATAATAA 22 80 

GACGACTGTT AAATTTGAAC GTGATGGTAA AACAAAGTCA GTTGAATTAA CACCTAAAAA 2340 

GACTGAAAAA AAACTGACTA AAGTAAGTTC AGAGACGAAG TATGTTCTCG GATTCCAACC 2400 

15 

AGCGAGTGAA CATACACTTT TTAAACCAAT TGTATTCGGA TTTAAAAGCT TTTTAATCGG 2460 

TAGTACTTAT ATTTTTACAG CTGTAGTAGG TATGTTGGCT AGTATATTTA CGGGCGGATT 2520 

2 0 CTCATTTGAT ATGTTAAATG GTCCGGTTGG TATTTATCAT AACGTCGACT CAGTTGTTAA 2580 

AGCGGGTATC ATTAGCTTAA TTGGTtnCAC TGCGTTATTA AGTGTAAACT TAGGTATTAT 2640 

GAATTTAATT GCTATTCCTG CACTAGACGG TGGTCGTATT TT ATTTGTT A TATATGAAGC 2700 

25 GA T ' XTI CAGA AAACCAGTTA ATAAAAAAGC GGAAACAACG * ATTATTGCTA TTGGTGCCAT 2760 

TTTCATGGTC GTTATAATGA TATTAGTAAC GTGGAATGAT ATTCGACGAT ATTTCTTATA 2820 

ATTTAGGAGG ATAAATAATT ATGAAGCAAT CCAAAGTTTT TATACCAACG ATGCGTGACG 2880 

30 TGCCATCAGA AGCAGAAGCA CAAAGTCATC GTTTATTATT GAAATCGGGT TTGATAAAAC 2940 

AAAGTACAAG TGGGATTTAT AGTTATTTAC CGCTAGCAAC ACGTGTGTTA AATAATATTA 3000 

CTGCAATTGT GCGACAAGAA ATGGAACGTA TCGATTCTGT TGAAATTTTA ATGCCAGCGT 3060 

35 

TACAACAAGC TGAATTATGG GAAGAATCAG GACGTTGGGG TGCATATGGC CCAGAATTAA 3120 

TGCGTTTACA AGATAGaCAT GGAAgACAAT TTgCATTAGG TCCaACACAT GAAGAATTAG 3180 

TTACATCAAT AGTAAGAAAT GAATTGAAAT CATACAAACA ATTACCGATG ACATTATTCC 324 0 

40 

5LAATTCAATC TAAATTCCGT GATGAAAAGA GACCACGTTT TGGTTTAyTC GTGGGCGTGA 33 00 

ATTTATTATG AAAGATGCAT ATTCATTCCA TGCTGACGAG GCATCATTAG ATCAAACGTA 3360 

45 TCAAGATATG TATCAAGCGT ATAGCCGTAT TTTTGAGAGA GTTGGCATTA ACGCAAGACC 3420 

AGTAGTTGCA GATTCAGGTG CTATAGGCGG TAGCCATaCA CATGAATTTA TGGCATTAAG 3480 

TGCTATCGGT GAGGATACAA TCGTTTACAG TAAAGAAAGT GATTATGCTG CTAACATCGA 3540 

50 AAAAGCAGAA GTCGTTTACG ArcCAaATcA TaAGCATACT ACTGTGCAAC CTTTAGAAAA 3600 

AATTGAAACA CCAAATGTTA AGACTGCGCA AGAATTGGCA GACTTCTTAG GTAGACCAGT 3660 
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GCGTGGCCAT 


CATGAAATTA ATGACATTAA ATTAAAATCT 


TATTTCGGCA 


CAGATAATAT 


3780 




TGAATTAGCA 


ACACAAGACG 


AAATTGTTAA 


TTTAGTTGGT 


GCAAATCCTG 


GTTCACTAGG - 


3840 


5 


TCCTGTAATT 


GATAAAGAAA 


TCAAAATTTA TGCAGATAAT TTTGTGCAAG 


ATTTAAATAA 


3 900 




TTTAGTTGTC 


GGTGCTAACG 


AAGATGGTTA 


TCACTTAATT 


AATGTAAATG 


TAGGTAGAGA 


3960 




CTTCAACGTT 


GATGAATATG 


GCGATTTCCG 


TTTTATTTTA. 


GAAGGCGAAA 


AGTTAAGTGA 


4020 


10 


TGGTTCAGGC 


GTTGCACATT 


TTGCTGAAGG 


TATTGAAGTT 


GGTCAAGTAT 


TCAAATTGGG 


4080 




TACTAAGTAT 


TCAGAATCAA TGAATGCTAC ATTCTTAGAT AACCAAGGAA AAGCTCAATC 


4140 


15 


TTTAATTATG 


GGTTGTTACG 


GAATTGGAAT 


TTCTAGAACG 


CTAAGTGCGA 


TTGTTGAACA 


4200 


AAATCACGAT 


GATAATGGAA 


TTGTTTGGCC 


TAAATCAGTT 


ACTCCGTTTG 


ATTTACATTT 


4260 




^^X^X X X^^X«^X X 


AATCCTAAGA 


AAGATGATCA 


ACGAGAACTA 


GCAGATGCAC 


TATATGCTGA 


4320 


20 


ATTTWATAtTP 

X% XXX mXSm X X 


AAATTTGATG 


TGTTGTACGA TGATCGTCAG 


GAACGTGCAG 


GTGTTAAATT 


4380 


TAATGATGCC 


GATTTAATTG GTTTACCACT GCGAATTGTT GTTGGTAAAC GTGCATCGGA 


444 0 




f*V7V3 x n X X w x 


GAAGTTAAAG 


AACGTTT AAC . 


AGGTGATAGC 


GAAGAAGTTC 


ACATTGATGA 


4500 


25 


fm |w | m ^ TV*^ & /' w 1 1 
l^x Innlvwivl 


GTCATTACAA 


ATAAATATGA TAACTTAAAA 


TAATTAAGAT 


CGAATGAATT 


4560 




AT A Art ArtTAf2 


GAAAAAGCTG 


AAAGAAATCT 


GATGCTTATG 


TCCTGCTCTT 


ATTATTTTTG 


4620 




. n^nx ^x^^ x v*rt x 


TATTCGATGA 


AAAATGACTG 


AAGACATAGT 


ATAATTAAAG 


ATAAATTTGT 


4680 


30 


TTT'JX ZVOZViXTA. 

XXX ^^fc^» * x ^» 


TAATGATTAG 


C CAAAT AT AA 


AGCATTTAAT 


TTTCTATCAT 


TACTATGCTC 


. 4740 




ACATAATCTA 


AATATTGTTC 


GAACACGTAA 


AAGTAATTTC 


TATTTAAGGT 


GGTAATTGTC 


4800 




TTGGCAATGA 


CAGAGCAACA 


AAAATTTAAA 


GTGCTTGCTG 


ATCAAATTAA 


AATTTCAAAT , 


4860 


35 


CAATTAGATG 


CTGAAATTTT 


AAATTCAGGT 


GAACTGACAC 


GTATAGATGT 


TTCTAACAAA , 


.4920 




AACAGAACAT 


GGGAATTTCA 


TATTACATTA 


CCACAATTCT 


TAGCTCATGA 


AGATTATTTA 


4980 




TTATTTATAA 


ATGCAATAGA 


GCAAGAGTTT 


AAAGATATCG 


CCAACGTTAC 


ATGTCGTTTT 


5040 


40 


ACGGTAACAA 


ATGGCACGAA 


TCAAGATGAA 


CATGCAATTA 


AATACTTTGG 


GCACTGTATT 


. 5100. 




GACCAAACAG 


CTTTATCTCC 


AAAAGTTAAA 


GGTCAATTGA 


AACAGAAAAA 


GCTTATTATG 


5160 


45 


TCTGGAAAAG 


TATTAAAAGT AATGGTATCA AATGACATTG 


AACGTAATCA 


TTTTGATAAG 


5220 


GCATGTAATG 


GAAGTCTTAT 


CAAAGCGTTT 


AGAAATTGTG 


GTTTTGATAT 


CGATAAAATC 


5280 




ATATTCGAAA 


CAAATGATAA 


TGATCAAGAA 


CAAAACTTAG 


CTTCTTTAGA AgCACaTATT 


5340 


50 


CAAGAAGAAG 


ACGAACAAAG 


TGCACGATTG 


GCAACAGAGA 


AACTTGAAAA 


AATGAAAGCT 


5400 




GAAAAAGCGA 


AACAACAAGA TAACAACGAA AGTGCTGTCG ATAAGTGTCA AATTGGTAAG 


5460 
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GCAATAGAGG GTGTCATTTT TGATATAAAC TTAAAAGAAC TTAAAAGTGG TCGCCATATC 5580 

GTAGAAATTA AAGTGACTGA CTATACGGAC TCTTTAGTTT TAAAAATGTT TACTCGTAAA 5640 

5 AACAAAGATG ATTTAGAACA TTTTAAAGCG CTAAGTGTTG GTAAATGGGT TAGGGCTCAA 5700 

GGTCGTATTG AAGAAGATAC ATTTATTAGA GATTTAGTTA TGATGATGTC TGATATTGAA 5760 

GAGATTAAAA AAGCGACAAA AAAAGATAAG GCTGAAGAAA AGCGTGTAGA ATTCCACTTG 5820 

10 

CATACTGCAA TGAGCCAAAT GGATGGTATA CCCAATATTG GTGCGTATGT TAAAGAGGCA 5880 
GCAGACTGGG GACATCCAGC CATTGCGGTT ACAGACCATA ATGTTGTGCA AGGATTTCCA , 5940 

GATGCTCACG GAGCAGCGGA AAAACATGGC ATTAAAATGA TATAGGGTAT GGAAGGTATG 6000 

1S 

TTAGTTGATG ATGGTGTTCC GATTGCATAC AAACCACAAG ATGTCGTATT AAAAGATGCT 6060 

ACTTATGTTG TGTTGGAOGT TGAGACAACT GGTTTATCAA ATCAGTATGA TAAAATCATC 6120 

GAGCTTGCAG CTGTGAAAGT TCATAACGGT GAAATCATCG ATAAGTTTGA AAGGTTTAGT 6180 

20 

AATCCGCATG AACGATTATC GGAAAGGATT ATCAATTTGA CGCATATTAC TGATGATATG 6240 

TTAGTAGATG CGCCTGAGAT TGAAGAAGTA CTTACAGAGT TTAAAGAATG GGTTGGCGAT 6300 

25 GCGATATTCG TAGCGCATAA TGCTTCGTTT GATATGGGGT TCATCGATAC GGGATATGAA 6360 

CGTCTTGGGT TTGGACCATC AACGAATGGT GTTATCGATA CTTTAGAATT ATCTCGTACG 6420 

ATTAATACTG AATATGGTAA ACATGGTTTG AATTTCTTGG CTAAAAAATA TGGCGTAGAA 6480 

30 . TTAACGGAAC ATCACCGTGC CATTTATGAT ACAGAAG CAA CAGCTTACAT TTTCATAAAA 6540 

ATGGTT CAAC AAATGAAAGA ATTAGGCGTA TTAAATCATA ACGAAATCAA CAAAAAACTC 6600 

AGTAATGAAG ATGCATATAA ACGTGCAAGA CCTAGTCATG TCACATTAAT TGTACAAAAC 6660 t 

35 CAACAAGGTC TTAAAAATCT ATTTAAAATT GTAAGTGCAT CATTGGTGAA GTATTTCTAC 6720 

CGTAGACCTC GAATTCCACG TTCATTGTTA GATGAATATC GTG AGGGATT ATTGGTAGGT 6780 

ACAGCGTGTG ATGAAGGTGA ATTATTTACG GCAGTTATGC AGAAGGACCA GAGTCAAGTT 6840 

40 

GAAAAAATTG CCAAATATTA TGATTTTATT GAAATTCAAC CACCGGCAGT TTATCAAGAT 6900 
TTAATTGATA GAGAGCTTAT TAGAGATACT GAAACATTAG ATGAAATTTA TCAACGTTTA - 6960 
ATAGATGCAG GTGACACAGC GGGTATACCT GTTATTGCGA CAGGAAATGC ACACTATTTG , 7020 

45 

TTTGAACATG ATGGTATGGG ACGTAAAATT TT AAT AG CAT CACAACCCGG CAATCCACTT 7080 

AATCGCTCAA CTTTACCGGA AGCACATTTT AGAACTACAG ATGAAATGTT AAAGGAGTTT 714 0 

so CATTTTTTAG GTGAAGAAAA AG CGCATGAA ATTGTTGTGA AAAATACAAA CGAATTAGCA 7200 

GATCGAATTG AACGTGTTGT TCCTATTAAA GATGAATTAT ACACACCGCG TATGGAAGGT 726 0 
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CTGCCTCAAA TCGTAATTGA TCGATTAGAA AAAGAATTAA AAAGTATTAT CGGTAATGGA 7380* 

TTTGCGGTAA TTTACTTAAT TTCGCAACGT TTAGTTAAAA AATCATTAGA TGATGGATAC 7440 

5 

TTAGTTGGTT CCCGTGGTTC AGTAGGTTCT AGTTTTGTAG CGACAATGAC TGAGATTACT 7500 

GAAGTAAACC CGTTACCGCC ACACTATATT TGTCCGAACT GTAAAACGAG TGAATTTTTC 7560 

AATGATGGTT CAGTAGGATC AGGATTTGAT TTACCTGATA AGACGTGTGA AACTTGTGGA' 7620 

10 

- GCGCCACTTA TTAAAGAAGG ACAAGATATT CCGTTTGAAA CATTTTTAGG ATTTAAGGGA 768 0 

GATAAAGTTC CTGATATCGA CTTAAACTTT AGTGGTGAAT ATCAACCGAA TGCCCATAAC 774 0 

^ TACACAAAAG TATTATTTGG TGAGGATAAA GTATTCCGTG CAGGTACAAT TGGTACTGTT 7800 

GCTGAAAAGA CTGCTTTTGG TTATGTTAAA GGTTATTTGA ATGATCAAGG TATCCACAAA 7860 

AGAGGTGCTG AAATAGATCG ACTCGTTAAA GGATGTACAG GTGTTAAACG TACAACTGGA 7920 

20 CAGCATCCAG GGGGTATTAT TGTAGTACCT GATTACATGG ATATTTATGA TTTTACGCCG 7980 

ATAGAATATC CTGCCGATGA TCAAAATTCA GCATGGATGA CGACACATTT TGATTTCCAT 8 040 

TCTATTCATG ATAATGTATT AAAACTTGAT ATACTTGGAC ACGATGATCC AACAATGATT 8100 

25 CGTATGCTT C AAGATTTATC AGGAATTGAT CCAAAAACAA TACCTGTAGA TGATAAAGAA 8160 

GTTATGCAGA TATTTAGTAC ACCTGAAAGT TTGGGTGTTA CTGAAGATGA AATTTTATGT 8220 

AAAACAGGTA CATTTGGGGT ACCAGAATTC GGTACAGGAT TCGTGCGTCA AATGTTAGAA 8280 

30 GATACAAAGC CAACAACATT TTCTGAATTA GTTCAAATCT CAGGATTATC TCATGGTACA 834 0 

GATGTGTGGT TAGGCAATGC TCAAGAATTA ATTAAAACCG GTATATGTGA TTTATCAAGT 8400 

- . GTAATTGGTT .GTCGTGATGA TATCATGGTT . TATTTAATGT ATGCTGGTTT- AGAACCATCA 8460 

35 

ATGGCTTTTA AAATAATGGA GTCAGTACGT AAAGGTAAAG GTTTAACTGA : AGAAATGATT . 8520 

GAAAeGATGA AAGAAAATGA AGTGCCAGAT TGGTATTTAG ATTCATGTCT TAAAATTAAG 8580 

TACATGTTCC CTAAAGCCCA TGCAGCAGCA TACGTTTTAA TGGCAGTACG TATCGCATAT 864 0 

40 

TTCAAAGTAC ATCATCCACT TTATTACTAT GCATCTTACT TTACAATTCG TGCGTCAGAC 8700 

TTTGATTTAA TCACGATGAT TAAAGATAAA ACAAGCATTC GAAATACTGT AAAAGACATG 8760 

TATTCTCGCT ATATGGATCT AGGTAAAAAA GAAAAAGACG TATTAACAGT CTTGGAAATT 8820 

45 

ATGAATGAAA TGGCGCATCG AGGTTATCGA ATGCAACCGA TTAGTTTAGA AAAGAGTCAG 888 0 

GCGTTCGAAT TTATCATTGA AGGCGATACA CTTATTCCGC CGTTCATATC AGTGCCTGGG 894 0 

so CTTGG CGAAA ACGTTGCGAA ACGAATTGTT GAAGCTCGTG ACGATGGCCC ATTTTTATCA 9000 

AAAGAAGATT TAAACAAAAA AG C TGGATTA TCTCAGAAAA TTATTGAGT A TTTAGATGAG 9060 
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GAAATAATCA AGGTATTTAT TTAATGCGTA TGGCGTAGTC AAAGAAATAC AAAATTGTTG 9180 

CTGGACACAA AATTATGCCC GTATTTCTTT TCAATGTCTT ACGAGTCTAT TCAAATGTAA 9240 

TGGTGAAATA AAGGAACAAA CTTTTACAAG AATCTCTGAT TAATAGTGAA GTCATTTGTT 9300 

TCAAGGATAA ACTTATGCTA TAATTAAGTT GCTTAAAAAT TAGTGAACTC AGGCAGAAGA 9360 

GTGGGAGATT CCCGCTCTTT TCTATTTGCC AAAAAGGGAG GCCTGTATGA GTAAAATTAC 9420 

AGAACAAGTA GAAGTGATTG TTAAACCAAT TATGGAAGAC TTGAATTTTG AACTTGTAGA 9480 

CGTTGAATAT GTCAAAGAGG GTAGAGATCA TTTTCTTAGA ATCTCTATTG ATAAAGAAGG 9540 

TGGCGTAGAT TTAAATGATT GTACGCTAGC TTCTGAAAAA ATAAGTGAAG CTATGGATGC 9600 

AAATGATCCT ATTCCTGAAA TGTATTATTT AGACGTAGCG TCACCTGGTG CAGAACGTCC 9660 

AATTAAAAAA GAACAAGATT TCCAAAATGC AATAACTAAA CCTGTATTTG TTTCTTTATA 9720 

TGTACCAATT GAAGGTGAAA AGGAATGGTT AGGCATTTTA CAAGAAGTCA ATAATGAAAC 9780 

AATTGTAGTA CAAGTTAAAA TCAAAGCAAG AACGAAAGAT ATAGAGATAC CGAGAGAGAA 9840 

AATAGCAAAA GCACGTCACG CAGTTATGAT TTAACGTGAf GAGGAGGAAA AAACGTGTCA 9900 

AGfAATGAAT TATTATTAGC TACTGAGTAT TTAGAAAAAG AAAAGAAGAT TCCTAGAGCA 9960 

GTATTAATTG ATGCTATTGA AGCAGCTTTA ATTACTGCAT ACAAAAAGAA TTATGATAGT 10020 

GCAAGAAATG TCCGTGTGGA ATTAAATATG GATCAAGGTA CTTTCAAAGT TATCGCfCGT 10080 

AAAGATGTTG TTGAAGAAGT ATTTGAGGAC AGAGATGAAG TGGATTTAAG TACAGCGCTT 10140 

GTTAAAAACC GTGCATATGA AATTGGTGAT AT ATACGAAG AAGATGTAAC ACCTAAAGAT 10200 

TTTGGTCGTG TAGGTGCTCA AGCAGCGAAA CAAGCAGTAA TGCAACGTCT TCGTGATGCT 10260 

GAACGTGAAA TTTTATTTGA AGAATTTATA GACAAAGAAG AAGACATACT TACTGGAATT 10320 

ATTGACCGTG TTGACCATCG TTATGTATAT GTGAATTTAG GTCGTATCGA AGCTGTTTTA 10380 

TCTGAAGCAG AAAGAAGTCC TAACGAAAAA TATATTCCTA ACGAACGTAT CAAAGTATAT ,10440 

GTTAACAAAG TGGAACAAAC GACAAAAGGT CGTCAAATCT ATGTTTCTCG TAGCCATCCA 10500 

GGTTTATTAA AACGTTTATT TGAACAAGAA GTTCCAGAAA TTTACGATGG TACTGTAATT 10560 

GTTAAATCAG TAGCACGTGA AGCTGGCGAT CGCTCTAAAA TTAGTGTCTT CTCTGAAAAC 10620 

AATGATATAG ATGCTGTTGG TGCATGTGTT GGTGCTAAAG GCGCACGTGT TGAAGCTGTT 10680 

GTTGAAGAGC TAGGTGGTGA AAAAATCGAC ATCGTTCAAT GGAATGAAGA TCCAAAAGTA 10740 

TTTGTAAAAA ATGCTTTAAG CCCTTCTCAA GTTTTAGAAG TTATTGTTGA TGAAACAAAT 10800 

CAATCTACAG TAGTTGTTGT TCGTGATTAT CAATTGTCAT TAGCGATTGG TAAAAGAGGA 10860 
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GATGCGCGTG AAGCGGGTAT CTATCCAGTA GTTGAAGCTG AAAAAGTAAC TGAAGAAGAT , 10980 

GTTGCTTTAG AAGATGCTGA CACAACAGAA TCAACCGAAG AGGTAAATGA TGTTTCAGTT 11040 

GAAACAAATG TAGAGAAAGA ATCTGAATAA TAGGTTGGAG TGAAGTATCT ATGAAAAAGA 11100 

AAAAAATTCC GATGCGAAAA TGTATTCTTT CAAATGAAAT GCATCCCAAA AAAGATATGA 1116 0 

TTCGTGTTGT TGTTAATAAA GAAGGCGAAA TCTTTGCGGA TGTTACTGGA AAGAAACAAG 11220 

GCCGTGGCGC ATATGTTTCT AAAGATGTTG CTATGGTTGA AAAAGCACAA CAAAAAGAAA 11280 

TTTTAGAAAA ATATTTTAAA GCATCTAAAG AGCAATTGGA -TCCTOTTTAC AAAGAAATTA 1134 0 

TTAGATTAAT TTAT AGAGAA GAGATCCCAA AATGAGTATA GATCAAATAT TAAACTTTTT 11400 

AGGATT AG CA ATGAGAGCTG GTAAAGTAAA AACAGGTGAA TCAGTCATTG TTAATGAGAT 11460 

TAAAAAAGGA AATTTGAAGC TCGTTATTGT TGCAAATGAT GCGTCTGATA ATACAGCTAA 11520 

ATTAATTACA GATAAATGTA AGAGTTACAA AGTTCCATTC AGAAAGTTTG GAAATCGAAA 11580 

TGAATTGGGA ATAGCACTTG GAAAAGGTGA GCGTGTTAAT GTAGGGATTA CTGACCCAGG 1164 0 

CTTTGCTAAA AAGTTGCTAT CAATGATAGA TGAATATCAT AAGGAGTGAT TATATGAGTA 11700 
~ AACAAAGAAT TTACGAATAT GCGAAAGAAT TAAATCTAAA GAGTAAAGAG ATTATAGATG - 11760 
AGTTAAAAAG CATG AATATT GAGGTTTCAA ATCATATGCA AGCTTTGGAA GATGACCAAA : 11B20 

TTAAAGCATT AG AT AAAAAG TTCAAAAAAG AACAAAAGAA CGACAATAAA CAAAGCACTC 11880 

AAAATAATCA CCAAAAATCA AACAATCAAA ACCAAAATAA AGGGCmACAA AAAGATAACA . 11940 

AAAAGAATCm ACAACAAAAT AATAAAGGCA ACAAAGGCAA TAAAAAGAAT AATAGAAATa 12000 

ATAAGAAAAA TAACAAGAAT AATAAACCAC AAAATCAACC AGCTGCTCCA AAAGAAATAC 12060 

CATCAAAAGT GACATATCAA GAAGGTATTA CAGTAGGCGA ATTTGCGGAT AAATTAAATG 12120 

TTGAATCATC AGAAATTATC AAAAAATTAT TCTTACTTGG TATTGTTGCT AATATCAATC 12180 

AATCATTAAA TCAAGAAACA ATCGAATTAA TTGCCGATGA TTATGGCGTT GAGGTTGAAG 12240 

AAGAAGTTGT GATTAATGAA GAAGACTTAT CAATCTATTT CGAAGACGAA AAAGATGATC . 12300 

CAGAGGCAAT TGAGAGACCA GCAGTTGTAA CAATTATGGG ACATGTTGAC CATGGTAAAA 12360 

CGACTTTATT AGATTCAATT CGTCATACAA AAGTTACAGC AGGTGAAGCA GGCGGAATCA 12420 

CTCAACATAT TGGTGCATAT CAAATTGAAA ACGATGGCAA AAAAATCACT TTCTTAGATA 12480 

CACCGGGACA TGCTGCATTT AGAACGATGC GTGCGCGTGG TGCa CAAGTA ACAGATATTA 12540 

CTATTTTAGT AGTAGCAGCT GACGATGGTG TTATGCCACA AACAATTGAA GCAATTAACC . 12600 

ATGCTAAAGA AG CAgAAGTA CCAATTATTG TTGCAGTAAA TAAAATTGAT AAACCAACTT 12660 
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15 



20 



GCGGCGAAAC AATTtTCGTc CACTT T CTGC ATTAAGTGGT GATGGTATCG ACGATTTATT 12780 

AGAAATGATA GGATTAGTTG CAGAAGTTCA AGAACTTAAA GCAAATCCTA AAAACCGTGC 12840 

TGTTGGTACA GTTATCGAAG CTGAATTAGA TAAATCACGT GGTCCTTCTG CATCATTATT 12900 

AGTACAAAAC GGTACATTAA ATGTTGGTGA TGCGATTGTA GTTGGTAATA CTTACGGCCG 12960 

TATCCGTGCA ATGGTTAATG ACTTAGGTCA AAGAATCAAA ACGGCTGGTC CATCAACGCC 13020 

TGTTGAAATT ACAGGTATTA ATGATGTGCC ACAAGCTGGG GATCGCTTTG TTGTATTTAG 13080 

TGATGAAAAA CAAGCTCGTC GTATTGGTGA ATCAAGACAC GAAGCTAGCA TTATACAACA 1314 0 

ACGTCAAGAA AGTAAAAATG TTTCATTAGA TAACCTGTTT GAACAAATGA AACAAGGTGA 13200 

AATGAAAGAT TTAAACGTTA TTATTAAAGG TGATGTTCAA GGTTCTGTTG AAGCTTTAGC 13260 

TGCATCATTA ATGAAAATTG ATGTTGAAGG CGTAAATGTT CGTATCATTC ATACAGCGGT 13320 

TGGTGCAATT AATGAGTCAG ACGTGACACT TGCTAATGCC TCAAATGGTA TTATCATTGG 13380 

TTTCAATGTT CGTCCAGACA GTGGTGCAAA ACGTGCTGCA GAAGCTGAAA ATGTTGATAT 1344 0 

GCGTTTACAC AGAGTTATTT ATAATGTTAT CGAAGAAATT GAATCAGCGA TGAAAGGTTT 13500 

25 ACTTGATCCA GAATTTGAAG AACAAGTTAT CGGACAAGCT GAAGTTCGTC AAACATTCAA 13560 

AGTTTCTAAA GTTGGTACTA TTGCTGGATG TTATGTTACT GAAGGTAAAA TTACGCGAAA 13620 

TGCTGGTGTA CGTATTATTC GTGATGGTAT TGTTCAATAT GAAGGCGAAT TAGATACACT 13680 

30 TAAACGTTTC AAAGATGATG CTAAGGAAGT TGCAAAAGGT TATGAATGTC GTATTACAAy 13740 

TGAAAACTAC AATGACCTTA AAGAAGGCGA TGTTATCGAA GCATTTGAAA TGGTTGAAAT 13800 

TAAGCGTTAA TTAAATAAAT TACAAGCTAA AAGTATAGTT AAGATTGATA TGCTCCCTAT 13 860 

AAATATTGCA CTTTTTAAGT GTCTACTTTA TAGGGAGCAT ATTTGATACT AGCTTTTGGT 13 920 

TTTfrATTAG AATAGATTAC CTATTAAAAG TTACGTTATA TGGACATGAT TTTGTATAAA 13980 

ATTTTGTGGT GGCCTAGAAT GATTTTTAAT GACAAAATAT AATGTCGACT ATTATTGGAA 1404 0 

AATTTTCTGT TGaAATGCCT ATCTTACGGC AAACTTTATT TGATTTTATA GGCTTAATTT 14100 

ATTAAAATAA CGTGTG AG CT AAAATAATTG TTTAAGCATT GTTACACTAA AAAATGCAAA 14160 

TAACAATTGA ACTTAAAGAT AAAGAGGTGA CAAGAATGAG CAGTATGAGA GCAGAGCGTG 14 220 

TTGGTGAACA AATGAAGAAG GAATTAATGG ATATCATCAA CAATAAAGTC AAAGATCCTC 142 80 

GAGTTGGTTT TATTACAATT ACAGATGTTG TTTTAACAAA TGATTTATCG CAGGCTAAAG 14340 

TATTTTTAAC TGTATTAGGT AACGATAAAG AAGTAGAAAA TACATTTAAA GCACTTGATA 14400 

AAGCAAAAGG CTTCATTAAG TCTGAATTAG GTTCTAGAAT GCGATTACGT ATTATGCCGG 14460 
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AAGATTTACA 


CAAACAAGAT 


AGATAATTTA 


GTGTTAGGTA 


TCTGGAAAAT 


GTTTGATAAT 


14580 




TTPTTAATAT 


CGGTATATTA 


ACATTAAACA 


GTTAATACAT 


AGATGTGTAG 


AAATAGTTAA 


■ 14640 


5 


l"* ATTTT {""fAfl 

X X. X X 


TTTTTTTATG 


AATAAATTTA 


GTTGATACGC 


TATTAAAATA 


TATTTTAAAA 


1470,0 




AAfJAARfJTfJA 


CTATATGTAT AATGGGATAT TACCAGTATA TAAAGAGCGC 


GGTTTAACAA 


1476.0 




I*5TP A T("2 A priT 


TGTATTCAAA 


TTGCGTAAAA 


TATTAAAAAC 


TAAAAAAATA 


GGTCACACGG . 


14B20 


10 


V7 inUui., X X wi 


TCCCGAAGTT 


GCAGGCGTGT 


TACCGGTATG 


TATAGGTAAT 


GCAACGAGAG 


14880 




X 1/UslUhl X*i 


TGTTATGGAT 


ATGGGCAAAG 


CTTATGAAGC 


AACTGTATCG 


ATAGGAAGAA 


1494 0 


15 




TGAAGATCAA 


ACGGGTGATA 


CATTGGAAAC 


AAAAGGTGTA 


CACTCAGCAG 


15000 


ATTTT AATAA 


GGACGATATT 


GACCGATTGT 


TAGAAAGTTT 


TAAAGGTATC 


ATTGAACAAA • 


15060 




TTCCGCCGAT 


GTACTCATCC 


GTCAAAGTAA 


ATGGTAAAAA 


ATTATATGAA 


TATGCGCGTA 


15120 


20 


ATAATGAAAC 


AGTTGAAAGA 


CCAAAGCGTA 


AAGTtAATAT 


TAAAGACATT 


GGGCGTATAT 


15160 




CTGAATTAGA 


TTTTAAAGAA 


AATGAGTGTC 


ATTTT AAAAT 


ACGCGTCATC 


TGTGGTAAAG 


15240 




- GTACATATAT 


TAGAACGCTA 


GCAACTGATA 


TTGGTGTGAA 


ATTAGGCTTT 


CCGGCACATA 


15300 


25 


TGTCGAAATT 


AACACGAATC 


GAGTCTGGTG 


GATTTGTGTT 


GAAAGATAGC 




15360 




AACAAATAAA 


AGAACTTCAT 


GAGCAGGATT 


CATTGCAAAA 


TAAATTGTTT 


CCTTXAGAAT 


15420 




ATGGATTAAA 


GGGTTTGCCA 


AGCATTAAAA 


TTAAAGATTC 


GCACATAAAA 


AAACGTATTT 


15480 


30 


TAAATGGGCA 


GAAATTTAAT 


AAAAATGAAT 


TTGATAACAA 


AATTAAAGAC 


CAAATTGTAT 


,1554 0 




TTATTGATGA 


TGATTCAGAA 


AAAGTATTAG 


CAATTTATAT 


GGTACACCCT 


ACAAAAGAAT 


15600 




CAGAAATTAA 


ACCTAAAAAA 


GTCTTTAATT 


AAAGGAGATA 


GAATTTATGA 


AAGTCATAGA 


15660 


35 


AuCuALALA X 


CCTATACAAT 


CTAAACAGTA 


TATTACAGAG 


GATGTTGCAA 


TGGCATTCGG 


. 15720 




ATTlTTTCGAT 


rznc anvsr" A Tl 

uuWn ±\s\~r\ X n 


AAUU X X VJrt 




GATATATTAA 


ACGAAATAGC 


15780 






AGTTTAAAAA 


AAGCGGTGAT 


GACATTTGAT 


CCGCATCCGT 


CTGTCGTGTT 


15840 


40 


UAnl LUiAMA 


AGAAAACGAA 


CAACGTATTT 


AACGCCACTT 


TCAGATAAAA 


TCGAAAAAAT 


15900 




T A fZPP A A C A T 


GATATTGATT 


ATTGTATAGT 


GGTTAATTTT 


TCATCTAGGT 


TTGCTAATGT 


15960 


45 


GAGCGTAGAA 


GATTTTGTTG 


AAAATTATAT 


AATTAAAAAT 


AATGTAAAAG 


AAGTCATTGC 


16020 


TGGTTTTGAT 


TTTACTTTTG 


GTAAATTTGG 


AAAAGGTAAT 


ATGACTGTAC 


TTCAAGAATA 


16080 




TGATGCGTTT 


AATACGACAA 


TTGTGAGTAA 


ACAAGAAATT 


GAAAATGAAA 


. AAATTTCTAC 


16140 


50 


AACTTCTATT 


CGTCAAGATT 


TAATCAATGG 


TGAGTTGCAA 


AAAGCGAATG 


ATGCTTTAGG 


16200 




CTATATATAT 


TCTATTAAAG 


kCACTGTAGT 


GCAAGGTGAA 


AAAAGGGGAA 


GAACTATTGG 


16260 
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TGCTGTTAGT ATTGAAATCG GCACTGAAAA T AAATT AT AT CGAGGGGTAG CTAACATAGG 16380 

TGTAAAGCCA ACATTTCATG ATCCTAACAA AGCAGAAGTT GTCATCGAAG TGAATATCTT 16440 

TGACTTTGAG GATAATATTT ATGGTGAACG AGTGACCGTG AATTGGCATC ATTTCTTACG 16500 

TCCTGAGATT AAATTTGATG GTATCGACCC ATTAGTTAAA CAAATGAACG ATGATAAATC 16560 

GCGTGCTAAA TATTTATTAG CAGTTGATTT TGGTGATGAA GTAGCTTATA ATATCTAGAG 16620 

10 

TTGCGTATAG tTATATAAAC AATCTATACC ACACCTTTTT CTTAGTAGGT CGAATCTCCA 16680 

ACGCCTAACT CGGATTAAGG AGTATTCAAA CATTTTAAGG AGGAAATTGA TTATGGCAAT 16740 

1S TTCACAAGAA CGTAAAAACG AAATCATTAA AGAATACCGT GTACACGAAA CTGATACTGG 16800 

TTCACCAGAA GTACAAATCG CTGTACTTAC TGCAGAAATC AACGCaGTAA ACGAACACTT 16860 

ACGTACACAC AAAAAAGACC ACCATTCACG TCGTGGATTA TTAAAAATGG TAGGTCGTCG 16920 

20 TAGcATTTaT TAAACTACTT ACGTaGTAAA GATATTCAAC GTTACCGTGA ATTAATTAAA 16980 

TCACTTGGTA TCCGTCGTTA ATCTTAATAT AACGTCTTTG AGGTTGGGGC ATATTTATGT 17040 

TCCAACCTTA ATTTATATTA AAAAAGCTTT TTACAAATAT TAACATTTAT TATATGTTAA 17100 

25 GCTAATATTG AGTGAATAAT AAGGTTACAA TGAGATAAAG ATGATATAAG TACACCTAGA 17160 

GTAATAATCA AGATATTAAA AATAAAGTAT GTTTTTTTAA AAAATATAAC TTATATTTAT 17220 

ACTGATAAGG GTGGGACGAT AAGTCTATTT TGTAAATAAT AGATGGATAT CCCGCTCTCT 17280 

30 _'~ 

TTTTTTCCAA TTCAATATTT TATAACTAAT ATTAAAATAC GATAATAAAT GATATGATAT 17340 

AACTATTAGA TTCAAGAGAG GAGATTTATA ATGTCTCAAG AAAAGAAAGT TTTTAAAACT 174 00 

GAATGGGCAG GAAGATCTTT AACGATTGAA ACAGGGCAAT TAGCTAAACA AGCAAATGGC 17460 

35 * 

GCTGTATTGG TTGGTTATGG AGATACAGTC GTGTTATCGA CGGCAACTGC ATCAAAAGAA 17520 

CCTCGTGATG GAGATTTCTT CCCATTAACA GTGAACTATG AAGAAAAAAT GTACGCTGCG 1758 0 

GGTAAAATTC CTGGTGGATT TAAAAAGAGA GAAGGACGTC CTGGTGACGA TGCAACATTA 1764 0 

ACTGCGCGAT TAATTGATAG ACCAATTAGA CCTTTATTCC CTAAAGGATA TAAGCATGAT 17700 

GTTCAAATTA TGAACATGGT ATTAAGTGCA GATCCTGATT GTTCACCACA AATGGCTGCA 17760 

4S ATGATTGGTT CATCTATGGC GCTTAGTGTG TCGGATATTC CATTCCAAGG GCCAATCGCC 17820 

GGTGTAAATG TGGGTTATAT TGACGGTAAA TATATCATTA" AGCCAACAGT AGAAGAAAAA 17880 

GAAGTTTCTC GTTTAGACCT TGAAGTAGCT GGTCATAAAG ATGCGGTAAA CATGGTAGAG 17940 

SO GCAGGCGCTA GTGAGATTAC TGAACAAGAA ATGTTAGAGG CGATTTTCTT TGGTCATGAA 18000 

GAGATTCAAC GTTTAGTTGA TTTCCAACAA CAAATCGTCG ACCACATTCA ACCTGTTAAA 18060 
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GAAGAAAAAG 
CTTGATAACT 
GAaTTACTTA 
. CGTTTAATTG 
TTAGATTCTG 
CAGACTCAAG 
GGTTTAGGAC 
GTAGGTGAAA 
GGTGAAAGAG 
ATTGTAAGTG 
ACATTAGCAT 
GGCCTTGTTA 
GCATTAGGTG 
ATGGATATTA 
AGACGTGGTC 
GAATTAAGTG 
GATGTTATCG 
TTAG AT ATTG 
CGTGCTCGTG 
GCCACTGTTA 
GCGTTGCTTC 
AAAATCGGTG 
GCTTCACATA 
TGTGATTTTT 
TTTTAAAACG 
ATAGTGTACA 
AACAAATTTA 
TATACCATTA 
TGAAATGTTT 



GACTTAAAGA 

TAAAAGAAGA 

TTAAAGAAGT 

CAGATGAAAA. 

AAGTTGGTAT 

CACTTTCAGT 

CTGAAGAAGA 

CTGGTCCAGT 

CATTAAAATA 

AGGTACTTGA 

TAATGGATGC 

CACGTGAAGA 

ATATGGACTT 

AAATTGACGG 

GTTTAGAAAT 

CTTACGCGCC 

GACCTGGTGG 

AACAAGATGG 

AAATCATTGA 

AACGTATTGA 

ACATTTCACA 

ACACAATTGA 

GAGCATTAGA 

TTATGCCACT 

CTTTATTATT 

TCAAGTGTTT 

GGAGGTAAGA 

GGCGGTGTTG 

ATGTTAGATG 



AACAGTTTTA 
AATCGTCAAT 
TTATGCAATT 
AATTAGACCA 
TTTACCTAGA 
TTTAACATTA 
AAAAAGATTC 
ACGTGCGCCA 
TATTATTCCT 
ATCAAATGGT 
GGGCGTACCG 
TAGCTATACG 
TAAAGTCGCT 
TTTAACGCGT 
AATGAATCAT 
AAAAGTTGTA 
TAAAAAAATT 
TACTATCTTT 
GGAAATTACA 
AAAATACGGT 
AATTTCAAAA 
AGTTAAGATT 
AGAATAATAT 
TTTTACGAAG 
TTGTGTGCAA 
TTTAACTTAT 
TTTTGAGTTT 
GCGAAATTGC 
CTGGACTTAT 



ACATTTGATA 
GAATTTATCG 
TTAAATGAAT 
GACGGCCGTA 
ACGCATGGTT 
GGTGCTTTAG 
ATGCATCATT 
GGTCGTCGTG 
GATACTGCTG 
TCATCATCTC 
ATTAAAGCAC 
ATTTTAACTG 
GGTACTAAAG 
GAAATTATCG 
ATGTTACAAA 
ACTATGACAA 
AACGAAATTA 
ATTGGTGCTG 
CGTGAAGCGG 
GCGTTTGTAG 
AATAGAATTG 
ACTGAAATTG 
TTAAAGTCAT 
TGACCCGTTT 
CTGTTAATTA 
AATGAATAGT 
AATAAAGAAA 
TAAAAATATG 
GTTTCCAGAA 



AACAACAACG 
ATGAAGAAGA 
TAGTGAAAGA 
AACCTGATGA 
CAGGTCTATT 
GCGATTATCA 
ACAACTTCCC 
AAATTGGACA 
ATTTCCCATA 
AAGCGTCAAT 
CAGTTGCTGG 
ATATCCAAGG 
AAGGTATTAC 
AAGAGGCTCT 
CAATTGATCA 
TTAAACCAGA 
TTGATGAAAC 
TTGATCAAGC 
AAGTAGGTCA 
GCCTATTCCC 
AAAAAGTGGA 
ATAAACAAGG 
ATGACGACAA 
TGAATTTGTT 
TCCTGTATGT 
GAGTTTATAT 
AAGAATAAAG 
TATATCGTTG 
GACGAAATGC 



AGATGaAAAT 
TCCAGAGAAT 
AGAAGTTCGA 
AATCCGTCCA 
TACACGTGGT 
ATTAATTGAT 
GAATTTTTCA 
TGGTGCGTTA 
TACAATTCGT 
TTGTGGATCA 
TATTGCTATG 
TATGGAAGAT 
AGCAATCCAA 
AGAACAAGCG 
ACCACGTACT 
TAAGATTAGA 
AGGTGTTAAA 
. TATGATAAAT 
AACTTATCAA 
AGGTAAAGAT 
AGATGTATTA 
TCGAGTAAAT 
TGTATCGTCA 
GTATTGAACA 
ATAGTGATTA 
ATGGACGGGT 
ATATTCGCAT 
AAGTAGACGA 
TAGGTATTGA 



18180 
18240 
18300 
18360 
18420 
18480 
18540 
18600 
18660 
18720 
18780 
18840 
18900 
18960 
19020 
19080 
19140 
19200 
19260 
19320 
19380 
19440 
19500 
19560 
19620 
19680 
19740 
19800 
19860 
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CCTTACACAC GGACATGAGC ACGCGATTGG TGCAGTGAGT TATGTTTTAG AACAATTAGA 19980 

TGCACCAGTA TATGGATCTA AATTGACAAT AGCGTTAATT AAAGAAAATA TGAAAGCCCG 20040 

TAATATTGAT AAAAAAGTTC GCTACTATAC AGTTAATAAT GATTCAATTA TGAGATTCAA 20100 

AAACGTGAAT ATTAGTTTCT TTAATACGAC ACACAGTATT CCTGATAGTT TAGGTGTTTG 20160 

TATTCACACT TCATATGGTG CCATTGTGTA TACAGGTGAA TTTAAGTTTG ACCAAAGTTT 20220 

ACATGGACAT TATGCACCAG ATATTAAACG TATGGCAGAG ATTGGTGAAG AAGGCGTATT 2 0280 

TGTCTTAATC AGTGATTCTA CTGAGGCAGA GAAACCTGGA TATAATACTC CGGAAAATGT 2 0340 

GATTGAACAT CATATGTATG ATGCTTTTGC AAAAGTGCGA GGTCGCTTGA TAGTTTCATG 2 04 00 

TTATGCTTCG AACTTTATAC GTATTCAGCA AGTTTTAAAT ATTGCTAGCA AGCTAAATCG 20460 

TAAAGTGTCA TTTTTAGGAA GATCACTTGA AAGTTCATTT AATATTGCTC GTAAAATGGG 20520 

GTATTTCGAC ATTCCTAAAG ATTTGCTAAT TCCTATAACA GAAGTTGATA ATTATCCTAA 20580 

AAATGAAGTG ATAATTATAG CTACTGGTAT GCAAGGAGAA CCTGTAGAAG CCTTAAGTCA 20640 

AATGGCGCAA CATAAGCATA AAATTATGAA TATCGAAGAA GGCGATTCTG TATTTTTAGC 20700 

AATTACGGCT TCTGCTAATA TGGAAGTTAT CATTGCGAAT AcATTAAATG AGCtTgTtAC 20760 

GnCTGGCGCA CATATTATTC CAAATAACAA AAAGATTCAT GCTTCAAGTC ATGGTTGCAT 20820 - 

GGAAGAATTA AAAATGATGA TTAATATTAT GAAACCTGAA TACTTTATTC CTGTACAAGG 20880 

TGAATTTAAA ATGCAGATAG CACATGCGAA GGTAGCAGCT GAAGCAGGTG TTGCACCAGA 2 0940 

-AAAGATTTTC CTTGTGGAAA AAGGAGATGT CATTAATTAC AACGGTAAAG ATATGATATT 21000 
AAATGAAAAG GTAAATTCAG GAAATATTTT AATAGATGGC ATTGGTATTG GGGATGTAGG ' 21060 

AAATATCGTG TTGAGAGACC GTCATCTTTT AGCAGAAGAT GGTATCTTTA TTGCTGTTGT 21120 

AACOTTAGAT CCTAAAAATA GACGTATAGC TGCGGGACCT GAAATTCAAT CTGGTGGGTT 21180 

TGTATATGTA CGTGAAAGTG AAGACTTATT ACGTGAAGCA GAAGAGAAAG TACGTGAAAT 21240 

AGTAGAGGCT GGTTTACAAG AAAAACGCAT AGAATGGTCT GAAATTAAAC AAAATATGCG 213 00 

TGATCAAATT AGTAAACTAT TATTCGAAAG TACAAAACGT GGTCCTATGA TTATTCCAGT 21360 

AATTTCTGAA ATTTAATCAA AAAGTCATTA ACATAAAAGA GGTCAGAACA AGTCACTGAA 21420 

ATATAATGGT TGTCATGGAC AATTTACTTA TATTTTATGA TAGTCAATTG AAGGGGTAAC 21480 
GATTAATCTG TTATCTTAAG TAAATTGATA CATAGATGAT ATTGTTCTAA CCTCTTTCAT ' 21540 

CGTCTGTTTG GAGTACATAT TCTAAACATC AAATAGGAAA TTATATATAA TAACGTCGTT 21600 

TTAACTAAGG CAACATAAGG AGGTGCGTCA ATTGGCACAA GCAAAAAAGA AATCGACAGC 21660 
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GATACGTTAT GTCATAGCTA TTTTAGTAGT TGTATTAATG GTGTTGGGTG TTTTCCAATT 21780 

AGGAATAATA GGTCGTCTAA TTGACAGCTT CTTTAATTAT TTATTTGGGT ACAGTAGATA 21840 

TTTAACATAT ATTTTAGTAC TGTTAGCAAC TGGTTTTATT AGATACTCTA AACGTATTCC 21900 

TAmaACTAGA CGAACGGCTG GTTCGATTGT ATTGCAAATT GCATTGCTAT TTGTATCACA 21960 

GTTAGTTTTT CATTTTAATA GTGGTATCAA AG CTGAAAGA GAACCTGTAC TTTCTTATGT 22020 

GTATCAGTCA TACCAACACA GTCATTTCGC AAATTTTGGT GGCGGTGTAT TAGG CT TTTA 22080 

TTTATTAGAG TTAAGCGTAC CTTTAATTTC ATTATTTGGT GTATGTATTA TTACTATTTT 22140 

ATTATTATGC TCAAGTGTTA TTTTATTAAC AAACCATCAA CATCGTGAAG TTGCAAAAGT 22200 

TGCACTGGAA AATATAAAAG CTTGGTTTGG TTCATTTAAT GAA 22243 
(2) INFORMATION FOR SEQ ID NO: 165: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5510 base pairs 

(B) TYPE: nucleic acid 
(C> STRANDEDNESS : double 
(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 165: 

TTATTAATnA TTAATATTTT TATTTTTAAA AATAAAGCGA GGAGCTATCA ATGGAACAAA 60 

TTACTTCTGC ACAAAATAAT AGAATTAAAC AAGCGAACAA GCTAAAAmAG AAACGTGAGA 120 

GGGATAAAAC TGGATTAGCT TTAATTGAAG GTGTGCATTT AATTGAAGAA GCTTATCAAA 180 

GTGGAATTGT AATTACACAA TTATTTGCAA TTGAACCGGC AAGATTAGAT CAGCAAATTA 240 

WCGCATACGC GCAAGAAGTT TTTgAAATAA ACATGAAAGT TGCTGAATCT TTATCAGGTA 300 

CAGT^ACACC ACAAGGGTTT TTCGCAATCA TTGAGAAGCC GCATTATGAT ATTTCTAAAG 3 60 

CACAACAAGT ATTGCTCATC GATCGTGTTC AAGATCCTGG AAATTTAGGC ACATTAATTA 420 

GAACTGCGGA TGCTGCTGGA ATGGATGCTG TAATAATGGA GAAGGGTACG ACAGATCCTT 4 80 

ATCAAGATAA AGTGTTGCGA GCGAGTCAAG GTAGTGTTTT CCATTTGCCA GTTATGACAC 540 

AAGATCTCGA TACGTTTATT ACTCAATTTA ATGGTCCTGT TTATGGTACA GCACTTGAAA 600 

ACGCAGTGgC ATACAAAGAA GTTACTTCAA GTGATTCTTT TGCATTACTA TTAGGTAATG 660 

AGGGAGAAGG TGTTAATCCT GAATTATTAG CACATACTAC ACAAAATTTA ATCATACCTA 720 

TTTATGGTAA AGCTGAAAGT TTAAATGTAG CGATTGCAGG TAGTATTTTA CTTTATCATT 780 

TGAAAGGTTG ACCGTGTTGA AAGTTTTCCG ATATAATTAT AATTAATTGT TTAACAGAAC 84 0 
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ATAAATAATT GTTTTAGGGA OAATAATCGT GACTGCAAGT TATTCCAATT ATTTAAAGTC 960 

TTTTCACCTT TTTGGTTACT TAAAGAGATT TAAGTCGGAA AGACAATCCG TTATCAATAT 1020 

TAAACAAGTG TATG CTTAGG CATAAATTTG GGTGGTACCA CGGAAATGAC TTTCGTCCCT 1080 

TATTTTTTAA GAGGATGAAA GTCTTTTTTT AGTTAAACAA CAAATATGAT AAATAGAAAA 1140 

TGAATAGTTC GAATAGGGAG GTCAGTGACA TATGtCTGAA CAAGAAACAA TGTCAGAGTT 1200 

AAAACAACAA GCGCTTGTAG ATATTAATGA AGCAAATGAT GAACGTGCAC TGCAAGAAGT 1260 

TAAAGTGAAA TACTTAGGTA AAAAAGGGTC AGTTAGCGGA CTAATGAAAT TGATGAAGGA 1320 

TTTGCCGAAT GAAGATAAAC CTGCGTTTGG TCAAAAAGTG AATGAATTGC GTCAAACAAT 1380 

TCAAAATGAA TTAGATGAAA GACAACAGAT GTTAGTTAAA GAAAAATTAA ATAAGCcAAT 1440 

TGGcTGAAGA AACAATTGAT GTATCATTAC CAGGTCGTCA TATTGAAATC GGTTCAAAGC 1500 

ATCCATTAAC ACGTACAATA GAAGAAATTG AAGACTTATT CTTAGGTTTA GGTTATGAAA 1560 

TTGTGAATGG ATATGAAGTT GAACAAGATC ATTATAACTT CGAAATGCTG AATTTACCTA 1620 

AATCACACCC TGCACGTGAT ATGCAAGATA GTTTCTATAT TACGGATGAA ATTTTATTAC 1680 

GTACGCATAC ATCACCAGTG CAGGCACGTa CGATGGAATC ACGTCATGGT CAAGGTCCAG 174 0 

. TT AAAATTAT TTGCC CTGGT AAAGTGTATC GTCGTGACTC TGATGATGCG ACACATAGTC 1800 

ATCAATTTAC ACAAATCGAA GGATTAGTTG TTGATAAAAA CGTTAAAATG AGTGATTTGA 186 0 

AAGGTACTTT AGAATTGTTA GCTAAGAAAT TATTTGGTGC TGATCGTGAA ATTCGTTTAC 192 0 

GTCCAAGTTA CTTCCCATTC ACTGAACCTT CTGTAGAAGT TGATGTGTCA TGTTTTAAAT 198 0 

" GTAAAGGAAA AGGTTGTAAT GTGTGTAAAC ACACAGGATG GATTGAAATT TTAGGTG CTG 204 0 

35 ' -• • 

GAATGGTACA TCCTAATGTA TTAGAAATGG CTGGTTTTGA TTCTTCAGAG TACTCTGGAT 2100 

TTGCATTTGG T ATGGGAC CA GACCGTATTG CAATGTTGAA ATATGGTATA GAAGATATTC 216 0 

40 GTCATTTCTA TACTAATGAT GTGAGATTTT TAGATCAATT TAAAGCGGTA GAAGATAGAG 2220 

GTGACATGTA ATGTTGATAT CAAATGAATG GTTGAAAGAA TATGTAACAA TCGATGATTC 2280 

TGTAAGTAAT TTGGCAGAAC GTATTACGCG CACAGGTATT GAAGTGGATG ATTTAATTGA 2340 

CTACACAAAA GATATCAAAA ATTTAGTTGT CGGCTTCGTT AAGTCAAAAG AGAAACATCC 24 00 

TGATGCTGAT AAATTAAATG TTTGCCAAGT TGATATCGGA GAAGACGAAC CTGTACAAAT 2460 

CGTTTGTGGT GCACCGAACG TTGaTGCAGG ACAATATGTC ATTGTTGCTA AAGTAGGTGG 2520 

CAGATTGCCT GGTGGTATTA AAATTAAGCG TGCCAAATTA CGCGGTGAAC GTTCAGAAGG 2580 

TATGATTTGT TCGTTAC7VAG AAATTGGTAT TTCAAGTAAC TATATACCGA AAAGTTTTGA 2640 
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ATATTTAGAT GATCAAGTAA TGGAATTTGA TTTAACGCCG AATCGTGGAG ATGGTTTAAG 
TATGATAGGT ACTGCTTATG AAGTTGCAGC ATTATATAAT ACAAAAATGA CTAAGCCAGA 
GACAACATCA AATGAGCTTG ATTTATCTGC AAATGATGAA CTGAGTGTGA CAATTGAAAA 
TGAAGATAAA GTACCATATT ATAGTGCACG TGTTGTTCAC GACGTGACAA TTGAACCCTC 
GCCAATTTGG ATGCAAGCAC GCTTAATAAA AGCGGGTATA CGTCGTATTA ATAATGTTGT 
TGACATTTCA AATTATGTGT TATTAGAATA CGGTCAACCA TTGCACATGT TTGATCAAGA 
TGCGATTGGT TCACAACAAA TTGTTGTTCG TCAAGCTAAT GAAGGCGAAA AAATGACAAC 
ATTAGATGAT ACAGAACGTG AATTATTAAC GAGCGATATT GTCATTACTA ATGGACAAAC 
TCCAATTGCA TTAGCTGGTG TTATGGGTGG CGATTTTTCA GAAGTTAAAG AACAAACATC 
AAATATAGTG ATTGAAGGTG CTATTTTTGA TCCAGTTTCA ATTCGTCATA GATCAAGACG 
TTTAAATTTA CGCAGTGAAT CATCTAGTCG TTTTGAAAAA GGAATAGCTA CTGAATTTGT 
AGATGAAGCA GTCGACCGTG CATGTTATTT ATTACAAACT TATGCAAACG GAAAAGTGCT 
AAAAGATAGA GTGTCTTCAG GAGAACTTGG TGCATTTATT ACACCAATCG ACATCACTGC 
TGATAAAATT AATCGCACTA TTGGATTTGA TTTGTCACAA AATGATATTG TTACTATTTT 
TAATCAACTA GGGTTTGATA CAGAAATAAA TGATGATGTT ATTACAGTGC TAGTACCATC 
ACGTCGTAAA GATATTACAA TTAAAGAAGA TTTAATTGAA GAAGTTGCAC GTATATATGG 
ATACGACGAT ATTCCATCAA CGTTACCTGT CTTCGATAAA GTTACTAGTG GTCAGCTAAC 
TGATCGCCAA TATAAAACTA GAATGGTTAA AGAAGTGTTA GAAGGTGCTG GATTAGACCa 
AGCTATTACG TATTCGTTAG TTTCTAAAGA AGATGCTACT GCaTTTTCGA TGCAACAGCG 
TCAAACAATT GATTTATTGA TGCCAATGAG TGAAGCGCAT GCGTCATTAC GTCAAAGTTT 
ATTJSCCACAT TTAATCGAAG CGGCATCATA TAATGTGGCA CGCAAAAAtA AAGATGTAAA 
ATTATTTGAA ATCGGCAATG TCTTCTTTGC TAATGGAGAA GGTGAACTAC CAGATCAAGT 
TGAATATTTA AGTGGTATTT TAACTGGAGA TTATGTAGTC AATCAATGGC AAGGTAAGAA 
AGAAACGGTT GATTTCTATT TAGCAAAAGG TGTCGTGGAT CGAGTATCTG AAAAGTTAAA 
TCTTGAATTT AGTTATCGCC GTGCTGATAT TGaTGGATTA CATCCAGGTC GTACTGCTGA 
AATCTTATTA GAGAATAAAG TTGTTGGTTT TATTGGTGAA TTACATCCAA TATTAGCAGC 
.TGATAATGAT TTAAAACGTA CGTATGTTTT TGAGTTGAAT TTTGATGCAT TAATGGCTGT 
GTCGGTAGGT TACATTAATT ACCAGCCAAT TCCGAGATTC CCAGGCATGT CTCGTGACAT 
TG C ATT AG AA GTAGATCAAA ATATTCCAGC AG CTG ATTTA TTATCAACGA TTCATGCACA 



2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 

3600 

3660 

3720 

3780 

3840 

3900 

3960 

4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 
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AAAAGGTAAA AAATCAATTG CAATACGTTT AAATTATTTA GACACAGAAG AAACATTGAC 4560 

AGATGAGCGC GTTTCAAAAG TACAAGCGGA AATTGAAGCA GCATTAATTG AACAAGGTGC 4620 

TGTTATTAGA TAATGATTTA AACCCCATGt ATAAGGATAT CTGAAGTAGA TTGATATCCC 4680 

TAACATGGGG TTTTATTTTT GGGTTCACCA ATTTGGTTCC AATGCATTTA AAAAGTCAAA 4740 

GAGGAACAGC GGAATACAGA TGATGC TTCG CACAACTGCA TAAAAGCCTC TAATGATTAA 4800 

AAATCAAAGA GGCTTTAAAA TTTTTTGGGC TTTTTCACGA TTTTTAAAAT GCTTTTTTGA 4860 

AATGGTATCT AAACGTGAAA GACCGTATTT TTTTATAATT TTGGCGGCGA TTACATCGAC 4920 

TTTAGCACCG GCACCTTTAG GAATCGTCAT ATTAATATTT TTTGATATTT GATCCATATA 4980 

TGTAACAAAT GCGTATCGAG AAATTATGCT TGCCACTGCA ATGGCTAATG ACTTCGATTC 5040 

TCCTTTTGTT TCAAATTTTG TTTTCTTTGG AAGTGGTATA TCTGATAATG CGTAATGGCT 5100 

20 ATACACTTCG CGTTTTGCGA ACTGATCAAT GACGATATAG TCTAATTGAG ACGAATCAAT 5160 

TTTTTCAAGT ACATTTTTGA TGGCTTCATT ATGAAGGGCA GCTTTCATTT TTACTTGAGT 5220 

CCAGCCTTTT GCTTGCTGAA TATTATATTT TTCATTGTGT AGTGTTAATA ATGAATGTGG 5280 

25 TATGAAAGTA ACCAATTGCT CAGCAAGTTC TACAATTTTG GTATCGGTTA ATTTTTTTGA 534 0 

ATCATCTACA CCCAAAGTTT TTAAAATAGG GACATGCTCT TTGGTAACGA AAGCAGCACA 54 00 

CACAGTCAAC GGACCAAAGT AATCGCCACT TCCAGCCTCA TCACTACCAA TACAGTTAAA 5460 

TTG rTCATAC ATTAaAGTTg TcCAgAAAAG AATTAGCCAT ATTTnCCTTT 5510 
.,(2). INFORMATION FOR SEQ ID NO: 166: 
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<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9623 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
r (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 166: 

GnTTATACTT ATAAATTTTA CGGGGGTAAT ATAATACTtA TTTACCTGTA ATATATGATA 60 

ATTCTTCAGC GGCAGCTGCG TTGATAGTTC TATGAGAAAT GATACCTAAT CCTTTAACAT 120 

TGGATTCTGA AATAACGATA GAACCATCAC TGTTAACTTT TTCAACAAAT GCTACATGAC 180 

CGTAATGTTG ATCTGCACCA AATTGTCCAG CCTCAAATAC AACAGCAGCA TGACGTTTTG 240 

GTGTATGACT TACTTGATAA TCACGGTATT GAGCTCGATT ATTCCAATTA TGTGCATCAC 300 

CTAAAT CACC TGAGATAGAT GTACCAAATT GTTTCATACG GTTATATACG TACCAAGTAC 360 
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ATGAATCATC 
CGTCAAACTG 
GATCTGTAGC 
ATTTCCATGT 
AGTAATCTTT 
ACAATTGATT 
CTTTGATACC 
ATTCTAAGAT 
GATGTGCATC 
TAAATTGTCC 
CACGTGTATC 
TCAATTCATC 
TTTTAGATTG 
AAATAGAGTC 
TTGCTTTATC 
AATTTGGTTG 
TGTCTGCTTT 
TGTTTTTATT 
TATCCGAATT 
ATTTATTTTT 
CAAlSATATT 
TGTCTTGGTT 
TAGAAGTTTC 
CTTTTTGAGG 
TTGATAGCAA 
TATAATAATT 
AGTTGATAGG 
GCAAAAATAA 
TGTGACAATG 



ATAATCCTTG ATAGAACGTT 
AGTTAATTGA TAGTGTTTAA 
ATATGTTTTA GATAAGTGTG 
TGGTTTATAA ATTGTTCGAT 
TAGTGATTCT TTCGTGCTTG 
ACCATCAGCT TCTAATGTGT 
GAATAAATTA TGGTTTGGTG 
TGCTTGGGCA ATCATGACAG 
TTTAGCAATT GATTTGACAA 
GCTATCATCA TTGTTAGATA 
CTTTTGATTA ACATCGTTAT 
TTGTGTTGGT AACTGTGGAT 
AGATGCATAA TCTTTTTGTG 
TAAAGCCGAA TGTGACATTG 
GTCACTTGCT GGTTGACTAT 
CTTATTAGAT GTACTTGGTT 
ATCTTGTTTA GATGATTGCG 
CGAATCATTT GTTGACTTTT 
TAAATTGAAT AAGTTTTGGA 
GGTTAGCAAT TGGTTTATAT 
GTTAGAGTCT GAAGTGCTGT 
ACTTGTATTA TTTTTGTCTG 
ATCGTCATTA GATTTTTTTG 
TGTATCAGCA TAAGCGgTAG 
ATAAATTAAA ATTTTATTTT 
AAGTGTGATA ATAAACTATG 
TATCAATCGA CTAAATATCT 
ATTAATTTAC AAAAAATATA 
AAGAACGCAT TTAAATTATT 



CATATTTATC 
TAATACTGTT 
ATGTTG CATC 
TGCCATCAAT 
GATATTTTCG 
TAAAAGGAAC 
ACwTAGCTAA 
ACGCATAAAT 
ATTGACGTGT 
TACTAGGATC 
TGAATGATTG 
TCTTTGTATT 
TTTTCTTTGC 
ATTGATTATC 
TTGATTGATT 
TTGTATTGTT " 
TATCAGTGTC 
CGCCATTACG 
TTAAAGTTGT 
TGGTTTGTGG 
CGTCTATAGT 
CTTTATCAAT 
AATCATGAGA 
GTGAAaCTAA 
TAGGCATATT 
ATTTGTTATA 
TCCAGTAAAT 
TAAAAAATAT 
TAAAATGGAT 



TAAATCTGGC 
TAATTTCTTA 
TTTATAAGAA 
ACCATTTTTA 
GAATCCAGCA 
AGAATTCCCT 
AGCACTACGA 
ATCGTTATCT 
ATCTTTTGAG 
TGTTTCGAAT 
AGCAGGTTTA 
AGATTTTTCA 
ATCTTCACTG 
TTTCGATGAA 
AGGTTGTGTT 
TGATTTAGGT 
ATTTTTGATG 
AGGTTGTTCG 
TAATGAGTAA 
TAAATTCTTA 
TTTAAATTTT 
ATCTTTACTT 
TGTTGTCTTA 
AGTAGGTAAT 
TCGTATTCTC 
ATTTATCGTA 
TGATTATACT 
GAATAATTCC 
CTGAAGAAAG 



ATGCGTTCAT 
GCATAGTTTG 
TCGGCTTCCG 
ATAAGGTCAG 
TTAATACTAT 
TCaAAAGCAC 
CCTGAGTCAG 
TGACCAATGC 
TCAACAACGT 
AATGATGTTG 
GATTTATGTT 
TTTTTGTCTT 
TATTGATCCA 
GATTTTTGAT 
GGCTTTGGCG 
GCTTTTTGAT 
CTATTGTCAC 
TAATCAGAAA 
TTATCATCGT 
TAAATAAAAT 
TTGTCGTTAT 
GTAGTATCCT 
GCTGTAGTAT 
ACGAGCGTAG 
CCTTGAAAAA 
TGCTGAAAAT 
AATTCACAAC 
TACATAGGAG 
TAGCTAAGAC 



-480 
. 540 
600 
660 
720 
. 780 
840 
900 
960 
1020 
1080< 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
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10 



15 



20 



30 



35 



40 



45 



50 



TAACTTATGG GCAATGTGGG ATCCATATGG 
TAATGAAGAT AAAGGCGACA CAATCAGAGG 
TAATACACTC AAGAAAAATA AAAGTTTTGA 
TCATGAGATA AAAATGGGTA AATATTTTGC 
TGAAATTACA GGGACACTAC GTAAGCAGCC 
TCAGAAGATT AACGCTGTTG CGTCTAAGCT 
AAAAGCGAAT GAACAATTTA ATAAAACAGT 
AGCAGGTTTA ACTATTGAAG AAAATGTGCC 
TTCAGCAGAT AAAGCTTTAC CTAAGATTAA 
TAACCACCAA GCGGATTTAG ATAAATATGC 
AGGTGATATT TTAGATGCTC AGAAAAAATT 
TAATGAAAAG GCTAAGTTGA TATTAGCTTT 
GTTAAATTTT GCAGCTGATG ACGTGCCAGC 
CATTGCGAGT CAAGGTATTG ATCAAG CTAA 
CACACAAGTT AGAAGTAGAG TCGGTGATTA 
AAATCGAAGA AACCAGCAAC AGATTCCTCA 
TAGTGCACCT GCAGCTGGTA ATGGTGTAGC 
TACTGCACCA AATAATAATG TTACGCAAAA 
ATCGACTACA CCACAAAGTA CAAGCGGGAA 
AACAACACAA GTCAGCACAG CTAACGAGAA 
ATCAtfTGGAA GCGGCATTAA CGGGCTCTTT 
AGCGAAAGCC GCACAAAAAG ATAGTCAGGC 
ATCGGACAAG CCTTCTGATT TTAGAGAGTC 
CACAACGCAA TATAATCAAC AATTTATCGA 
TGTTGATTTA TCAAAAGAAA TTGATAAGGT 
ATTAAGGTTA GTTAATCAAT TAAGCAATGC 
AG CT ACT AAA TTACTAGATC AACTTTCAAA 
TTATGTTAAA AAAGATCTTA ACAGCTCTTT 
ATTGAACAAA GGGCAAACTG CATTATCCAA 



CAACACGGGA CACATCAAGG TCGCAGTCGT 2280 

GAAAAAAGTT AATGTCGGTA ATACGATGGT 2340 

TTGGCAGTTT GTAAGTAGAG AGAAAGCTGA 2400 

AGGTATTTAC ATCCCATCTA AGTTTACACA 2460 

TCAAAAAGCA GATGTAGAAT TTAAGGTGAA 2520 

AACAGATACT GGTTCGTCAG TTGTCGTTGA 2580 

AACTCGAGCA TTATTAGAAG AAGCTAACAA 2640 

GACAATTAAC AAGATAAAAA ATGCGGTATA 2700 

TGACTTTGCG AATAAAATTG TATATTTGAA 2760 

CAATGATTTT AGAAAACTAG GAAATTATAA 2820 

AAACGAaGTC AATGGTGCTA TTCCGCAACT 2880 

AAATAATTAT ATGCCGAAAA TTGAAAAAGC 2940 

GCAGTTCCCT AAAATTAATC AAGGACTTAA 3000 

TGGACAGTTA AATGATGCCA AAGGCTTCGT 3060 

TCAAGATGCA ATTCGACGCG CGCAAGATTT 3120 

AAATAGCGCG GCGAACAACG AAACATCAAA 3180 

ATCAACGCCA CCAAGTGCAC CAAGTGGCGA 3240 

TACCGCACCA AATAGTAATA ATGCGCCTGT 3300 

AAAAGATGGT CAAAGTTTTG TAGATATAAC 3 360 

CACACAAAAC ATTACAGATA AAGATGTTAA 3420 

ATTATCATTA TCAAATAATT TAGATACCCA 34 80 

ATTACGTAAT ATTTCGTATG GGATTTTAGC 3540 

TTTAGATAAT GTTAAGTCCG GTTTAGAATA 3600 

TACATTAAAA GAGATTGAGA AGAATGAAAA 3660 

AAAAGCAGCT AATAATCGAA TTAATGAATC 3720 . 

ATTAAAGAAT GGTAGTTCAG GAACTGCTGA 3780 

ACTAGATTCA TCATTATCAT CATTTAGAGA 384 0 

AGTATGAATA TCACAACGTA TTATGGATGA 3900 

TGTT CAGTCT AAATTAAATA CAATTGATCA 3960 
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AACAGTATTA CCAAGTATTG AACAACAATA CATTAGTGCT GTTAAAAATG CTCAAGCAAA 4080 
CTTCTCGAAA GTGAAAAGTG ATGTAGcTAA AGCTGCTAAC TTTGTGCGCA ATGACTTACC . 4140 

5 

AGAGTTAGAA GAGCGATTAA CTAATGCGAC AGCAAGTGTG AATAAAAATT TACCAACGTT 4200 

ATTAAATGGT TATGATCAAG CGGTAGGATT ACTAAATAAA AATCAGCCAC AAGCGAAAAA 4260 

GGCTTTATCA GATTTAGCTG ATTTTTCTCA AAATAAATTG CCTGATGTTG AAAAAGATTT 4320 

10 

GAAAAAAGCG AATAAAATTT TCAAGAAATT AGAGAAAGAT GATGCAGTCG ACAAATTAAT 4380 

CGACACACTT AAGAATGATT TGAAAAAGCA AGCGGGTATT ATTGCAAATC CTATTAATAA 4440 

r5 GAAGACTGTT GATGTTTTCC CAGTTAAGGA TTATGGTTCA GGTATGACAC CATTCTATAC 4500 

TGCACTGTCA GTATGGGTAG GTGCACTCTT GATGGTAAGT TTATTAACGG TTGATAATAA 4560 

ACATAAGAGT CTAGAGTCAG TCTTAACGAC AAGACAAGTG TfCTTAGGTA AGGCAGGATT 4620 

20 CTTTATAATG CTTGGTATGT TGCAAGCACT CATTGTATCG GTTGGAGATT TGTTAATCCT 4680 

AAAAGCAGGA GTTGAGTCAC CTGTATTATT TGTACTTATA ACGATTTTCT GTTCGATTAT 4740 

TTTCAACTCA ATCGTATATA CGTGCGTATC ATTACTTGGT AACCCAGGTA AAGCCATTGC 4800 

25 

AATCGTATTG CTTGTATTAC AAATTGCAGG TGGTGGGGGA ACATTCCCAA TTCAAACTAC 4860 

GCCACAATTT TTCCAAAACA TTTCGCCATA CTTACCATTT ACGTATGCAA TTGATTCATT 4920 

ACGTGAAACA GTAGGCGGTA TTGTTCCGGA AATCCTAATT ACAAAATTAA TTATATTAAC 4980 

30 

GTTATTTGGT ATAGGATTCT TCGTTGTAGG TTTAATTTTA AAACCTGTAA CAGATCCATT 5040 

GATGAAGCGC GTATCTGAAA AAGTTGACCA AAGTAACGTT. ACAGAATAAA AATTAAATCC 5100 

55 ACACATTAGG GTTATAGCTC CTTAATGTGT GGATTTTTAT GTTTTTAGAC AGAAGAGATA 5160 

GTAATTTCTG TCTTTTATGG GACGGTTGTT ATCATTGCTA TTATCCAGGA TGACTTACTA 5220 

TAGGACTAAT ATTACGGACA AAGTGAATAT CCTCGTCTTC CGTAGTTAAA ATAAAGCTAG 5280 

40 AACCTTTTTG GATGTCATAG TGCTTATCGT TTACTGTTAA AGTACCAGTA CCATCGATAA 534 0 

TTGTAACTAA GCAATAAGCA TGTGGTTTAT TGAATTTTAA ATCTCCATGA ATATCCCATT 5400 

TATATACTGC AAAATATTGA TTATCTACAA ATTGAGTTAC AGTGTGTGTG TOGATGTGAG 5460 
45 - 

TTGTTATAGG AGTAGTATTT GGTTCATGAT TGCCTAATTC AATCACATCT TTACTTTGCT 5520 

CTAAGTGCAA ATCACGCAAT TGACCATTTT GATCTCGTCT ATCATAGTCA TAAATACGGT 5580 

£o ATGTCGTATC GGAGGATTGT TGTGTCTCTA AAATTAAAAT ACCCGAACCA ATGGCATGGA 5640 

CAGTGCCAGC AGGAACATAA TAAAAGTCAC GGGGCTTAAC AGGTATAGGT TTGAAAAGAC 5700 

TGTCAAATTC ATGATTATCA ATCATGTCTA TTAACGTCTG TTTATTATGT GCATGTACGC 5760 
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GTTCGCCTTC 


GTGTTTTAAA 


GCGTAGTCAT 


CATCTGGGTG 


AACTTGAACA 


GATAATTTAT 


5880 




CATTGGCATC 


TAATACTTTA 


GTTAGCAGAG 


GGAAACTATC 


TCGTGAATCA 


TTATCGAATA 


5940 


s 


ATTCACGATG 


TTGTGACCAA 


AGTTGATCTA 


GGGTCATATC 


CTTGTATGGA 


CCATTGATAA 


6000 




TTGTATTAGG 


ACCATTTGGA 


TGTGCAGAAA 


TTGCCCAGCA 


TTCACCAGTT 


GTTTCATTAG 


6060 


10 


GGATATCATA 


GTTAAATGCT 


TTTAATGCAT 


GACCGCCGCA 


AATTCTGTCT 


TTAAAAACGG 


6120 


GTTGTAAAAA 


TAATGCCATA 


GTTAAAACTC 


CTCTATATTT 


TCATTAATAA 


GTTATAAATT 


6180 




TCTGTAGTAC 


TGTTTGCATT 


. AATTAGTGAT 


TGGCGTGTCT 


CATCATTCAT 


TAACGCTTTA 


6240 


15 


GATAAGCGCT 


GAAGTATTTT 


TAAATGTGTA 


TCCTGACTGT 


TGTTTGGTAC 


GGCAATTAAG 


6300 




AATATCAATT 


GAGGTAGACT 


ACCATCTAGA 


CTGTCCCATT 


TAACACCATG 


ATTATTTTTC 


6360 




ATAACAGCTA 


CAATCGGTTG 


TTTTACAACA 


TCAGACTTTG 


CATGTGGAAT 


GGCCACGTTC 


6420 


20 


ATGCCAATAG 


CTGTCGTAGm 


tCcATTTCAC 


GTTCTAGTAT 


TGCATTTTTT 


AAATGCGATG 


6480 




TGTGCTCTAC 


ATAACGGCAA 


ATTTTAAGTT 


TATGAATCAA 


CATATCAATT 


GCTTCGTTTC 


654 0 




GAGACATGTC 


GTGATCAGTA 


ATTATCATAG 


TTTGTTGATC 


AAAAACATGA 


GAAGGTTTAT 


6600 


25 


TGAGATGTGA ATGTTTCGCG 


GTGTTATCTA 


CATTGTCAAC 


CTCTGTATCA 


TGTTGTGTAA 


6660 




TATCTGTATC 


ATGAAGTTGC 


GTGTGTTGCG 


CTGGTGCATC 


TACTGCTATA 


ACTGGTGTAT 


6720 


30 


TGOGTTTTAA TAATAGTACA GTAGT CATTG TGACAAGACT AC CTACTATC ACTGCAAAGA 


6780 


TAAACCATAA 


TACATGATCA 


ATACCACCTA 


ATACAGCCAC 


GATTGGACCT 


CCATGTGCGA 


6840 




CTCTATCGCC 


GACACCACCA 


ATGGCTGCAA 


TGACTGATGC 


AATCATTGCA 


CCAATGATGT 


6900 


35 


TTGCAGGTAT 


AATGCGCAAT 


GGATCTTGGG 


CTGCGAAAGG 


AATAGCACCT 


TCAGTAATAC 


6960 




CAAATAGTCC 


CATAGTGAAG 


GAAGCCTTAC 


CCATTTCTCT- 


TTCGGAATGA 


TTGAATTTAT 


7020 




ACTTTTGAAC AAACGTTGCT AAACCTAAAC 


CGATTGGTGG 


TGTACATACA 


GCAACTGCGA 


7080 


40 


CCATACCCAT 


AACGGCGTAA 


TTACCTTCAG 


CAATAAGTGC 


TGAGCCAAAT 


AAAAATGCTA 


7140 




CCTTGTTTAC 


TGGACCGCCC 


ATATCGAAGG 


CAATCATCGC 


ACCTATAATC 


ATCGCAAGTA 


7200 




TAATAATATT 


AGCACCTTGC 


ATACTTTTTA 


ACCAGGTTGT 


TAATGCCTCA 


AAAATATTAG 


7260 


45 


AAATTGGTGC 


ACCGATTAAA 


AATATAAAT A 


TCAATCCTAC 


AACGACCGAT 


GAAATAATGG 


7320 




GAATAATAAT 


GATAGGCATA 


ATTGGTGCCA 


TTGCTTTTGG 


AACTTTAATA 


TCTTTAATCC 


7380 


50 


ACTTTGCGAT 


ATAACCTGCT 


AAGAAACCAG 


CAACAATACC 


ACCTAAAAAT 


GCTGCGCCTG 


7440 


CATCACTGCC 


ATAAAAACTA 


CCGTCAGCAG 


CGATAGCGCC 


GCCAATCATA 


CCAGGAACAA 


7500 




GACCGGGCTT 


GTCAGCGATA 


CTAACAGCGA 


TATATCGAGC 


TAGTATTGGA 


ACCATAAATT 


7560 
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ATCCTTTTGA 


TGTCGTTtCA CCGCCTAGAG 




ClCX fV2 71 T*ZV & rtT2 


ftrtTr , r^7if^r»7A a 

AL»XU<J/iV~L>lA 


7680 




CTACGATAAA AGGAACCATA AACGATACAC 


Lul iuAl Inn 


niul XuninL 




7740 


5 


TACCATTTTT 


AGACTTACCG 


CGATCTTTCG 


71 71 TY2 71 T71 ATT 




1 x AftAT AG 


7800 




GCGCATCTTG 


ATTAATGATA 


CGTTGAATTA 


wiVrL- X L. X WVjv 


71 T*H 71 Tn 71 71 Tf 


r*t **\ u \*f~ t r**r*r* T\ Ti 

t-tTx. 1 t-taCGAA 


7860 


10 


CATTTTCATT 


AATCAACCGT 


TTACCAACAA 


J. Cwunwiu 


ATCAACTTGT 


TTATCAGCTG 


7920 




CAATTATGAC 


ACCGTCAGCT 


TCTTCGATGT 




TAAAACATTT 


TCAGCACCAA 


7980 




CACCGCCCTG 


TGTCTCTACT 


TTAATATCCA 


CACCCATTTC 


TTTTGCTACC 


TGCTCAAGCT 


8040 


15 


TTTCTTGAGC 


CATATATGTA 


TGTGCAATGC 


CATTTGGGCA 


TGAGGTAATA 


GCTACAATTT 


8100 




TCATAAAATC 


ATCTCCTTTT 


CTATATTGTA 


AGCGTATTCT 


CGATACTAAA AAAAAGAATA 


8160 




ATTACCGTTA 


CTAGTGGGAA 


TTATTCTTGT 


AAGTATTCAA 


ATAACTGTTG 


CTTTAAACTA 


8220 


20 


TGATCATCTA 


AACTACATAA 


ATGGTTCACT GAATCATCAT 


CCAAGTTAGC 


AATTAATTGC 


8280 




ATCATTTGTT 


TTGTAAAAGC 


TTTGTCTTTA 


TGCGAAATCG 


CTAAGAAAAA 


GACAAGTTTG 


. 8340 




ACATCGTGTT 


GTCGCCAAGG 


AAAAACATCT 


TTTGTGCGAA 


AAATAAGCAC 


ATGTGATTGT 


8400 


25 


- AAAACTTTTT 


CAGGATCTCC 


ATGAGGAATC 


GCCATAAAAT 


TACCTATGTA 


TGTAGAAGAT 


B460 




GATTTCTCAC 


GCTCTAAAGC 


TGATTCGATA 


TATCCTTCTA 


CAATCGCATG 


ATGTGCTTGT 


8520 


30 


AATATTTTTT 


GAGCTTCTTC AAAAATTTGC ACAGTATGCC 


GTGATTTTTG 


TTCAGTATTT 


8580 


ACGACAAGGA 


AATTGACAGT 


GTCCATATGA 


TGATGTG CTT 


GAACCGGATT 


TTGCTTTTGC 


8640 




TTCACAACGT 


GTGTGATTTT 


GTGACGATCA 


TCTTCAGAAA 


ATAATGGTGC 


AACCTTGATA - 


8700 


35 


GTCGTCAGGT 


GCTTAGGAAG 


TATGTTTAGC 


GTTTGTTTAG 


GAATATCATG 


GGTCGTTATT 


8760 




AATAAATCTA 


CATTGTCAAA 


GTGATAGTGT 


GTTATATTTT 


CTAGTTTAAT CGTATTTATC 


8820 




ACTGACAACT 


CTTCGGATAA 


GTTATTTATT 


TTAGTTTCTA 


AAAAATTCGA 


CACACCTAGA 


8880 


40 


CCATAATAAC 


AAGCAATGAC 


TACATTTAAT 


TGTGTTTTGG 


TACGACGCTC 


GATGG CAGCT 


8940 




TGAAAATGAA 


TTGTTAAAAA 


TGCAATTTCA 


TCTTCGCTCA 


TCTCTATATC 


AGTATCAATT 


9000* 




GCTAATTTAT 


CAATCGCTTC 


AAAAAGTGTG 


TTAAACACAA 


AGGGATAGAG 


TTTTTTAATC 


9060 


45 


TCTATAACTA 


AAGGATTGTT 


TAAATAAATG 


TTTTGAGTGA 


TACGTAAATA 


TGCTTTACTA 


9120 




AAATGATTAT 


ATAAATTTTG 


TTGTAAAATC 


GAATCTTCAT 


TGAAAGGTAC 


ATGAATACGT 


9180 


SO 


TGCTGCATCA 


ATTCGATTAA 


GCGATCAATA 


TAACTTTGTA 


TAAATATACG 


TTCTATGCCA 


9240 


ATATCGAGTT 


TATTAAAATG 


ATAAGCAATA 


AAGAATGAAA 


ACATATTGAT 


TACTTTTTCG 


9300 




TTCAAGTCAT 


AACCTAATCT 


TTCGTTGATT 


TGCTTAATGC 


AAGATTGAGA 


TATCAATTTT 


9360 
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25 



30 



35 



45 



SO 



AGATGAATTA AAAGCTGTTG TATTTGAATA TCAGTTGTTT CAATACTATG TTGTTGAAGT 9480 

GTCTCTTGTA TAATATGCGA AATCATCCTT TGGTGTGAAT CAGGTAATTC aTTTAAAATT 9540 

AGGTCTTCAA CATGTACATG CCCTGATGAT AATTGATTTA AATGGATGAT GGCATTAGTG 9600 

ATATCATTAT CTGTTCCATC GAC 9623 

(2) INFORMATION FOR SEQ ID NO: X67 : 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 1021 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 167: 

20 ACCGTGGAAA CACGTCTAGT CAATCAGAAA GCGATAAAAA TGTGACTAAA TCATCTCAAG 60 

AGGAAAATCA AGCAAAAGAA GAATTACAAA GCGTTTTAAA CAAAATTAAC AAACAATCAA 120 

GTAAGAATAA TTAAAAAATT TTGATATTGT CTATGTTTAT AGTTCACAAG CCATTCAACG 180 

TATTGTAAAC TAAGGATAGT GTATTTTTTT AATAGTAATT TGTCAGGAGG TGCCTATCTA 240 

TGGAAGAACA TTACTACGTA AGTATTGATA TTGGATCATC AAGCGTAAAA ACAATAGTAG 300 

GCGAGAAATT TCACAATGGT ATAAATGTGA TAGGTACAGG ACAAACCTAC ACGAGCGGTA 360 

TAAAAAATGG TTTAATTGAT GATTTTGATA TTGCGCGACA AGCAATCAAA GACACAATTA 42 0 

AAAAGGCATC AATCGCTTCG GGTGTTGATA TTAAAGAAGT TTTCCTGAAA TTAC CTATCA 4 80 

TTGGAACGGA AGTTTATGAT GAATCAAATG AAATCGACTT TTATGAGGAT ACAGAAATCA 54 0 

ACGGTTCACA TATCGAAAAA GTATTAGAAG GTATTAGAGA AAAAAATGAT GTGCAAGAAA 600 

CAGAAGTAAT TAATGTGTTC CCGATTCGTT TTATAGTCGA TAAAGAAAAT GAGGTTTCAG 66 0 

40 ACCCTAAAGA ATTAATTGCC AGACATTCAT TAAAGGTTGA AGCAGGCGTA ATTGCTATTC 720 

AAAAATCGAT TTTAATTAAT ATGATTAAAT GCGTAGAAGC ATGTGGTGTT GATGTATTAG 780 

ATGTTTACTC TGATGCATAT AACTATGGTT CAATCCTAAC AGCTACTGAA AAAGAGTTAG 84 0 

GTGCATGTGT CATTGATATT GGTGAAGACG TTACGCAAGT TGCTTTTTAT GAACGCGGTG 900 

AATTAGTAGA TGCTGATTCT ATCGAAATGG CAGGGCGTGA TATTACaGAC GATaTTGCAC 960 

aAGGrTTaAA CACTTCTnAT GAAACTGCTG nAAAAAGTTA AACACCAATn TGGTCATG C A 1020 

T 1021 
(2) INFORMATION FOR SEQ ID NO: 168: 
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(A) LENGTH: 7963 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 





<xi) 


SEQUENCE DESCRIPTION: 


SEQ ID NO: 


168: 






10 


TAATCTATTA 


TAAAAACTGT 


CCATACCCTT 


TGATTACCTT 


CTCTTCAGGT 


ACAGGCCACA 


60 




CTTGAGGCCA TAAGCCATAT 


, GCTTGCTGTG 


AATAAAATTG 


TGCCATTTGT 


AACAATATAA _ 


120 




TATATACAAA TAAACACCCA ATAATTGCTG 


TCACTAATGG 


ATATGATAAC 


CAAACCATTA 


180 


1S 


ATAAAACTGC 


AATAATTACT 


AACCTAAAGA 


TAATATTAAA 


TGCGTCTCTC 


CCTCTTATAA 


240 




AGCTTCTAAT 


AAATAAGAAT 


AAATACATCG 


CATTAGAGTT 


AAATTTACTA 


CCCTTTGGAA 


300 




CTGGTAAAAG 


TATATCTAGA 


TAACTTCTTC 


TGACTGCAGA 


TTCTTTCAAA 


TGTTTTACAT 


360 


20 


CGGTGAACAT ATTAACAAAT 


TTATAATAAT 


TCATATGATG 


TCGATGTTCG 


ATTGCAATCA 


420 




TTTTCTCCCA 


AGGATACAAA 


AAGCCTGGTT 


TATATTTTTT 


AACTAAAAAT 


TCTATTAACA 


480 


25 


CAGGCAAAGC AACCATCACA AATGCGATGT 


ACCATTTTGG 


AGCTAATAGT 


AAGTAATATG 


540 


TTAGAGCAAA 


GGTGATGAAT 


GATATTAAAT 


TAACTTGCCA 


TGTTTTAAGT 


CCCGATTGAT 


600 




ACCATTGCCA 


TCTTAAGCGT 


AAACCAACAT 


ATGGAAAAAT 


TAATGCACTG 


ACTCCAAAAC 


660 


30 


AAATATAAAA 


TGCCACATTA 


TGTTGATTAA 


TATTGTAAAA 


CAACGGGAAC 


ATTACAATAA 


720 




CAATAATGAG 


TTGGATTAAT 


ATGCGCGCAA 


AGTAACTATA 


TAAAAT CGCA 


TGACGCATAA 


780 




ATTGAGACAT 


GTGTTTTTCA AATGGTAATA AAAAGATTTT ATCCgCTTCT TTTAACAGTG 


84 0 


35 


GTCsCmTTGG 


AAAAATAGrT 


GTCAACGCAA 


CAATCACTGC 


TGCTATTaAT 


GAAAAATTGa 


900 




TATTCGTTGG 


AATATGTTTT 


AACCATTcAC 


CATATCCAr A 


AATAAATGCA 


CCCAGCAAAA 


960 




TAAGTAAAAA 


GACCATGAAA 


TGACCATTAA 


ATATAAACTT 


ATTAT AATAA 


TTTTtCTCTT 


1020 


40 


TACGAAGGGC ATGTAATCTT 


TTATTAAATA ATGTGGTAGC 


TTGGTTACGC 


ATGTACATCT 


1080 




CCACCTTGCG 


TCACATGAAT 


ATATATATCG 


TCTAATGTTT 


GATTATGTAA 


GCCAGTTTGT 


1140 


45 


TGTCTCAATG 


CTTCTAAATC 


TCCAAATGCA 


ACGACTTCAC 


CTTCGTCTAG 


TATGaTAAAA 


1200 


CGATCACAGT 


AACGTTCAGC 


TGTTGCTAAA 


ATATGTGTAC 


TCATTAGAAC 


GGTTCTACCT 


1260 




TCGTTTTTCT 


TTTCAACCAT 


TAAATCTAAC 


ATGGATTGAA 


TTCCTAATGG 


ATCTAGGCCA 


1320 


50 


AGGAATGGTT 


CGTCTATAAT 


ATACAATTCG 


GGATTAACGA 


TAAACGCACA 


AATAATCATG 


1380 




ACTTTTTGTT 


TCATCCCCTT 


AGAAAAATGA 


CTCGGAAAAA 


CTTTCAACTC 


ATTTTCTAAA 


1440 




CGGAATGTCT 


TTAATAATGG 


CATTGCTCGA 


TTCATCGTTT 


CATCACGATC 


AATATCATAT 


1500 
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TCCOGAATAT AAGATAACTT TCTTCTATAA GCCTCTATGT CATCATTAAT GTTGATATCT 1620 

GAAATTGATA GAGATCGTTC CATAGGTGTA AGCAATCCTA GCATATGTTT AATCGTTGTA 1680 

CTCTTACCAG CGCCATTAAG GCCAATAAGT CCAACAATTT CGCCTTTGTT TAATTCAAAA 1740 

TTTATATCTT TAATTACAGG GCGTTTTCCA TATCCACGTG TAAGCTGTTC TACTTTAACT 1800 

GTCATAAGGC ACCTCCATGA CTTATATTGT ACCAAAAATT ATAAAATGCT CATATTAAAT I860 

ACACATGTCC TAATATCGAA TTTTTAGCGA CAATGTTATA ATGAATGGTA ATACTAGTTG 1920 

AAAAGGAGTG TAGTCATCAT GTCAGAAACA ATTTTCGGCA AAATTTTAAC TGGAGAAATT 1980 

CCTAGCTTTA AAGTATATGA AGACGATTAT GTCTATGCCT TTTTAGATAT ATCACAAGTT 2040 . 

ACTAAAGGAC ATACGTTATT AATTCCTAAA AAAGCTTCTG CTAATATCTT TGAAACTGAT 2100 

GAAGAAACAA TGAAACATAT CGGTGCAGCA TTACCTAAAG TAGCAAATGC TATTAAGCGT 2160 

GCATTTAATC CTGATGGTTT AAACATTATT CAAAATAATG GTGAGTTTGC AGATCAATCT 2220 

GTATTTCATA TTCATTTCCA CTTAATTCCT CGATACGAAA ATGATATTGA TGGATTTGGT 22 80 

TATAAGTGGG AAACACATGA AGACATTTTA GATAACGATG CAAAACAACA AATTGCTGAA 2340 

CAAATTCAAG CACAATTTTA AATGTATGCT TAATCTAAGC TCGAACGGGT ATAATATGAT 24 00 

TAATATTATA ACAATTGCGT TTGAAGTGAT AACATCAAGG TTAGCAATTT TAAACAAAAT 2460 

GAGTTATCAA GATAACAGAT GTTAAAAGTG AGGAGAATAT AAATGAAAGC ATCACGCATT 2520 

CTATTCGGTA TCGGTGTTGG CGTAGCAGCT GGTTTTGTAG TTGCACTTCA AGGACGTGAC 2580 

GACAAAAGTG TCAAGAACAA CAC GAT CG AT CGTACTGCCC CTACTGGTTC AAAATCAGAA 2640 

CTACAACGTG AATTTGAAAC GATTAAACAA AGTTTTAATG ACATTTTAAA CTATGGTGTT 2700 

CAAATTAAAA ACGAAAGTGC GGAATTTGGT AGTTCAATTG GTGGTGAAAT TAAGTCATTA 2760 

CTTGGAAACT TCAAATCTGA CATTAATCCT AATATTGAAC GTTTACAGTC ACACATCGAA 2820 

AATTTACAAA ATCGTGGCGA GGATATTGGA AACGAAATTT CTAAGTAGCA GGTTACGTTC 2880 

40 

TCGATCACAA CTATTTTTAT TAGTAACAGG ATATTTATTT TTTAAAATTA AATGCCAAAT , 294 0 

AAACGAGATG ACATTAGAAA TTAGATATTT CTTGTCATCT CTTTTTTAAA ACTCAAATGA 3000 

45 ACTTATGTTT ACAAATTATA GGAAGACATT GTTTGTAGTG ATTTTCGCTT AAATCATATT 3060 

TATGAATTGA TTGAAAACAT TGCTTAGGAT TCATTGTGTT ATCCtTGCAC TTTGATTACG 3120 

CTTTACTTAA ATCATTATCG ACAAACAACA TACTTATATT TTCATTGAGC CGAACCTTAT 3180 

SO ATACACATTA CATATACCTT ACTTGCACAA ATTATTAATC TGGTGTTTAT TATAATTACA 324 0 

TATCACTATA TTTTTAGCAT TTGTATAACT TAGTTGGTCA AAAGATGCTT TTG CAT ATG C 3300 
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TTTCATAAGT GATGCTTTAT TAGCAAGAAT ATGTGTTCGC AGAAATTTGT TCTGCATTCT 
ACTTCTACGC TAGTCAATCA GACAATTTTA CCAATCCCCA CTTTCGCGTT TCAAATCAAA 
CAATACGTCG CTCCTTTCTT CTTATATAAC AATTCTTCTA ACATGATATG TTACTATTGA 
ATTACTGAAC CTGAGTTAGT TATAATCTAA CTTATATTGA AAAGAGATGA GGCGTAAGAT 
ATGTTTTTAT GTAAAAGACA AATTGATATC AATGCACGAT TTGGTTTGCC TAGAATTGCA 
TTTATGAGTG CAGTTGCAAC CATCATTATG TTTTTAGTTA GTTATGAAGT AATGTATTTT 
TTATCTAATA CGCCATTATC AGATAGACAT TTTCTCATCT TTTTATTACT TGTATTTATG 
ACGTATCCAT TACATAAAAG TATACATTTA TTATTTTTCT TACCATATAG AAAATCGTTT 
AAAGTTCATA AGTTAACTAA AAGAAAATGG CTTATATTCT ATAATACCTA CGTCAATCAA 
CCTGTACACA AATTTTATTT TTGCATTAAC TTAATATTGC CGTTAATTAT CTTATCTGCA 
ATGTTCGTTT ATCTAACAAT TTCATTCCCG CAATATGGAC ATTATTTTAT GTTCTTATTG 
GCATTGAATT TCGGTATTTC CATTACAGAT TTATTATATT TAAAAATAAT TATATTTTCT 
AATTATGGAC AATATATAGA AGAACATAGT ACAGGTATTA ATATTTTGAA AAAAATTAAA 
AATCCATATC ATTTATAACA AAATAATTAT AGCAAGGTGT TATTATTTGT TTTTAGGCTA 
TGTAATAgcT tACAATCAAA TGTATATAGA CCTTGTTTTT TTATTTTCAT CAATTTCTAC 
CCCTAAACCT AATGCTCTAG TCTGATGTCA TGGGTTATTG ATTGGTGATA ATATAAAACT 
ATGTTATATT CAOGATGATT AACTTACAAA GGAGTTTCAA CTATGAAGAT - GATAAACAAA 
TTAATCGTTC CGGTAACAGC TAGTGCTTTA TTATTAGGCG CTTGTGGCgC TAGTGCCACA 
GACTCTAAAG AAAATACATT AATTTCTTCT AAAGCTGGAG ACGTAACAGT TGCAGATACA 
ATGAAAAAAA TCGGTAAAGA TCAAATTGCA AATGCATCAT, TTACTGAAAT • GTTAAATAAA 
ATTTtPAGCTG ATAAATATAA AAATAAAGTT AATGATAAGA AGATTGACGA ACAAATTGAA 
AAAATGCAAA AGCAATACGG CGGTAAAGAT AAATTTGAAA AGGCCCTTCA ACAGCAAGGT 
TTAACAGCCG ATAAATATAA AGAAAATTTA CGTACTGCTG C TT AT CAT AA AGAATTACTA 
TCAGATAAAA TTAAAATCTC TGATTCTGAA ATTAAAGAAG ACAGCArGAA AGCTTCACAC 
ATTTTAATTA AAGTTAAATC TAAGAAAAGC GACmAAGAAG GCTTAGATGA TAAAGAAGCG 
AAACAAAAAG CTGAAGAAAT TCAAAAAGAA GTTTCAAAAG ATCCAAGTAA ATTTGGTGAA 
ATCGCTAAAA AAGAATCAAT GGATACTGGT TCAGCTAAAA AAGATGGCGA ATTAGGTTAT 
GTTCTTAAAG GACAAACTGA TAAAGATTTT GAAAAAGCAC TATTTAAGCT TAAAGATGGT 
GAAGTATCAG AGGTTGTTAA ATCAAG CTTT GGATATCATA TT ATT AAAG C TGATAAACCA 
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AAAAATCCAA AATTATTGAC TGATGCATAC AAAGATCTAT TAAAAGAATA CGATGTTGAC 522 0 

TTTAAAGATC GTGATATTAA ATCAGTTGTC GAAGATAAAA TGTTAAACCC TGAAAAACTT 5280 

5 AAACAAGGTG GCGCACAAGG CGGACAATCC GGCATGAGCC AATAACACAA AACCGAGCGA 5340 

CCGTGGTTCA AAAATCATAC CACGGCCGCT CGGTTTTTTC GCATTAAAAA TCGGACAGAT 54 00 

GAGCTCATGT TTCAGTATAC TCATCTGTCC GATATCTTTT AATTCTTAAT CGAGTGATTC 54 60 

10 

AGGATTGTAG AATCTACGAT TTTCAAGACC AAATATTTTA TCTGTAAACT GACCCTTGTC 5520 

AGTTTTTTTA TATGCCTTTT CAAACATATT CATTGTAGCA TCGATATTAT CGATATAGGA 5580 

TAAAATTTCT GCTTCTTTTA AGTATGGCAG TTTTGGAGAA CCATACTCTA ACTTACCATG 564 0 

15 

ATGAGATAAA ATGATATGTC TTAACAACAT GATTTCTTCT CCTTCAATGT TCAATTCACG 5700 

AGCTGCTTCA ACTACTTCAT CACTCGCAAT CGAGATGTGT CCTAATAAGT TACCTTCGAC 5760 

2Q TGTATACGAC GTCGCAACAG GACCACTCAA TTCTCTAACT TTACCAATAT CATGCAAAAT 5820 

AATACCACTA TATAACAAAC TTTTGTTTAA CAATGGATAA ATGTCaCAAA TTGATTTTGC 5880 

AATACGTAAC ATCGTTAATA CATGATAGCT TAAGCCACTC GCAAAGTTAT GaTGATGAGA 5940 

25 ACTAGCAGCT GGATATGTGT AAAATCGTTC TTGATATTTT TTCAATAAAT GACGTGTGAT 6000 

ACGTTGTAAA TTAGCATTTT CAATATCTAG CAAATAATGA GAAATCTCTT CTTGTATTTC 6060 

* TGCCGGTGAT AAAGGTGCAC CATCTACAAA TTGTTCTGTT TTTAATTGAT CTT CAGTTGT 6120 

30 CGCTAGTCTA ATTTGGTTGA CTTTCATCTG TTTATTTCCG CGATAGTTTA TGATGTCACC 6180 

TTTAACATGT ACAATTTCTT CAGGCTTGAT TGTTGC CAT A TCATTTTTTG TAGCCGTCCA 6240 

AAATTTCGCT TCAATTTCAC CACTTTTATC TTGCAAATGT AATGTCATAT AATCTTT AC C 63 00 

35 

TTGTGCTGTT ACACCCTGTG TAGCTTTATG CACTAAGAAA AAGTGATCAA CTGAATCTCC 6360 

GGGATTTAGA TTCTCTATAT TTCTCATCGT TTCCCGCCTT CCTCTATTTT GTTTAATGTA 6420 

ATCACTTCTT TTGATGGAAC AATATTATCT TTTACACATG TAAAGTATAG TACTTGATAG 64 80 

40 

TGTTCTGATA ATGATCGTAA ATAATTCAAC ATTTTTTCAG TACX3TTTTTT ATCAAAATGA 654 0 

ACAAATGCAT CATCAACAAT TAATGGGAAC GGATAATATG GTCTTAGTAC CTTAATTAAA 6600 

4S CTGATACGTA AAGCTACATA AAGTAATTCT TTTGTAGATT GACTTAGTTC AACAGGATCA 6660 

TATAATTGAC CATTAACATG TTTAACCGTA ATTGAATCTT CATTATAGTT AATCATCGTA 6720 

TATCTGCCAT CTGTTAAATG CTTCAATATT TCTACCGCTT CATTAATAAC TTGAGGCAAA 6780 

50 CGTTTATCTT TAATTTGTTT AATGTGTTCA TCAACTAAAC TTTGTAAATA ACTTAAACTT 6840 

GCCCAATCTT TTGCGATATC ATTAAGTTGA TTTTTAAGAC TGTGATATTC ATGTCTTAAA 6 900 
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GCTTGCATTT CAAGATATTG CTCATTATAT TCGTCAACTT GAGTAGCCAA TAAATGATCT 
. TCTTCTTCAA GTTGTGCAGT TGTTTTTTCA CTTAAACTAG AACTTAATTC ATAAGAATAG 
TTTTGGTTCT CAAGATATTT AGTTAAATCA TTAAAACGAC TGAAATTACT AGTATAAGTT 
TGGTAATCTT CATGATGTTG GTAAAAATCT TCTTCAGTAC CAACATTGAT. AAAATCGAAT 
AGTGCTGTAA TTTCTTTATT ATTTTCTTCT AATTGAGCAT TTAAATGATT TAATTCATTT 
GTAACAAGTT TGGTATTTTC AGCATTAATA CGCCATTTTT CATTCGTGTC TTCAGCTGAT 
TTCAACCATT GTtGCACATC GTGGAATAAA GATAATTTGT TGAAATAAAC AAATTGTGAT 
TTTGTAACAG CTTCAGCATG ATTGTAGAAT GTATCT AATT CTTGAACCAA TTGCTGGCGT 
TGTTGATTTA AATCACTGAT ATGTTGATCT AATGCTTTAA TATTCGCCAT TGTAGAAATA 
CTATCAACAA TTAAATCATT TGAAATTTTA GATGATAAGT ATAATTCATC CTTAACX3TTC 
TCAACTGTCG ATTGTAATTC ATCATGACGC CCTTTCGCAT CATTTAAACG ACCTTCAATA 
TACTGACGTT TCTCTTCTAA AATATCTTTA TTTTTCAAAG CTTGTTGCCA GTGATCACGA 
ATGGGATATT GCTCATCAAG ATCAAAATCT AAGTCATAAT TTTCATCTAA AATGGCTAGT 
TGTGCTTTAA TTTCTTCGAT TTCATCTGTG ATGGCCTCGC TATAATCTAC TTCTTTTGAT 
TTAGACATGA TGATACCGAT AACAAATACT AAAGTTAATA CTGCGAAAAT AATACCAAAC 
AACATGTTGT TTGAAATAAA TGAGAAGGCA GTTAAACCAA TACCTACTAA TGTTAAAAGr 
ATAAACGTTG TTCGkAACAA TTTTTGACGT TTTTGttTTT CTT 
(2) INFORMATION FOR SEQ ID NO: 169: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3958 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
T (D) TOPOLOGY: linear 

(xi) SEQUENCE, DESCRIPTION: SEQ ID NO: 169: 
ATATTGTCTT TACAATAGTT TGCTATGGAG GTAATTAACC AATAGGAGGA ATTTATAATG 
GCAGTAATTT CAATGAAACA ATTACTAGAA GCGGGTGTTC mCttCGGTCA CCAAACACGT 
CGTTGGAACC CAAAAATGAA AAAATATATC TTCACTGAGA GAAATGGTAT TTATATCATC 
GACTTACAAA AAACAGTGAA AAAAGTAGAC GAGGCATACA ACTTCTTGAA ACAAGTTTCA 
GAAGaTGGTG GACAAGTCTT ATTCGTAGGA nCTAAAAAAC AAGCACAAGA ATCAGTTAAA 
TCTGAAGCAG AACGTGCTGG TCAATTCTAC ATTAACCAAA GATGGTTAGG TGGATTATTA . 
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GAAGATGGTT 


TATTCGAAGT 


1 ATTACCTAAA 


. AAAGAAGTAG 


TAGAACTTAA 


AAAAGAATAC 


480 




GACCGTTTAA 


TCAAATTCTT 


AGGCGGAATT 


CGTGATATGA 


AATCAATGCC 


TCAAGCATTA 


540 


5 


TTCGTAGTTG 


ACCCACGTAA 


AGAGCGTAAT 


GCAATTGCTG 


AAG CTCGTAA 


ATTAAATATT 


600 




CCTATCGTAG 


GTATCGTTGA 


CACTAACTGT 


GATCCTGACG 


AAATTGACTA 


CGTTATCCCA 


660 


10 


GCAAACGACG 


ATGCTATCCG 


TGCGGTTAAA 


TTATTAACTG 


CTAAAATGGC 


AGATGCAATC 


720 


TTAGAAGGTC 


AACAAGGCGT 


TTCTAATGAA 


GAAGTAGCTG 


CAGAACAAAA 


CATCGATTTA 


780 




GATGAAAAAG 


AAAAATCAGA 


AGAAACAGAA 


GCAACTGAAG 


AATAATCAAC 


TGTTGAATCT 


840 


15 


GACTTAGATA 


TAGTTTAAAT 


GGGTGATAAG 


ATATTAATGC 


TTATCACCTT 


TTTTAAAAAG 


900 




AAAATCGAGG 


CAAATTACAA 


ATATTCAATT 


AGAGTATTGG 


CAATCTTGCC 


TATAATAATG 


960 




CTAAAATCAT 


AATATATAAn 


ATGATAACTT 


ATTGGAGGAA 


TAATGAATGG 


CAACTATTTC 


1020 


20 


AGCAAAACTT 


GTTAAAGAAT 


TACGTGAAAA 


AACTGGCGCG 


GGTATGATGG 


ATTGTAAAAA 


1080 




AGCGCTAACT 


GAAACTGATG 


GTGACATCGA 


TAAAGCGATT 


GACTACCTAC 


GTGAAAAAGG 


1140 




TATTGCTAAA 


GCAGCTAAAA 


AAGCAGACCG 


TATTGCGGCT 


GAAGGTTTAG 


TACATGTAGA 


1200 


25 


AACTAAAGGT 


AACGACGCAt 


TATCGTTGAA 


ATCAACTCTG 


AAACAGACTT 


TGTTGCTCGT 


1260 




AACGAAGGTT 


TCCAAGAGTT 


AGTTAAAGAA 


ATCGCTAATC 


AAGTATTAGA 


TACAAAAGCT 


1320 




GAAACTGTTG 


AAG CTTTAAT 


GGAAACAACT 


TTACCAAATG 


GTAAATCAGT 


TGATGAAAGA 


1380 


30 


ATTAAAGAAG 


CAATTTCAAC 


AATCGGTGAA 


AAATTAAGTG 


TTCGTCGTTT 


TGCTATCAGA 


1440 




ACTAAAACTG 


ATAACGATGC 


TTTCGGCGCT 


TACTTACACA 


TGGGTGGACG 


GATTGGTGTA 


1500 


35 


TTAACAGTTG 


TTGAAGGTTC 


AACTGACGAA 


GAAGCAGCAA 


GAGACGTTGC 


TATGCATATC 


1560 


GCTGCAATCA 


ACCCTAAATA 


TGTTTCTTCT 


GAACAAGTTA 


GCGAAGAAGA 


AATCAACCAC 


1620 




GAAAGAGAAG 


TTTTAAAACA 


ACAAGCATTA 


AATGAAGGTA 


AACCAGAAAA 


CATCGTTGAA 


1680 


40 


AAAATGGTGG 


AAGGAGGTTT 


ACGTAAATAC 


TTACAAGAAA 


TTTGTGCTGT 


AGATCAAGtnT 


1740 




TCGTTAAAAA 


CCCTGATGTA 


ACAGTTGAAG 


CTTTCTTAAA 


AACAAAAGGT 


GGAAAACTTG 


1800 




TTGACTTCGT 


ACGCTATGAA 


GTAGGCGAAG 


GTATGGAAAA ACGCGAAGAA 


AACTTTGCGG 


1860 


45 


ATGAAGTTAA AGGACAAATG 


AAATAAT CTG 


TCATAAAGTA AAACAAGGAA 




1920 




TTAATGTTGC 


TTTATTAAAA 


TGTAAATCAT 


TCTAATAAAA 


CGACAACTGT 


GTCTTCTTTA 


1980 




CTTGTATATG 


TTACATATAT 


TCACGATAGA 


GAGGATAAGA 


AAATGGCTCA 


AATTTCTAAA 


2040 


50 


TATAAACGTG 


TAGTTTTGAA 


ACTAAGTGGT 


GAAGCGTTAG 


CTGGAGAAAA 


AGGATTTGGC 


2100 




ATAAATCCAG 


TAATTATTAA 


AAGTGTTGCT 


GAGCAAGTGG 


CTGAAGTTGC 


TAAAATGGAC 


2160 
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TTAGGTATGG ACCGTGGAAC TGCTGATTAC ATGGGTATGC TTGCAACTGT AATGAATGCC . 2280 

TTAGCATTAC AAGATAGTTT AGAACAATTG GATTGTGATA CACGAGTATT AACATCTATT 2340 

5 GAAATGAAGC AAGTGGCTGA ACCTTATATT CGTCGTCGTG CAATTAGACA CTTAGAAAAG 2400 

AAACGCGTAG TTATTTTTGC TGCAGGTATT GGAAACCCAT ACTTCTCTAC AGATACTACA 246 0 

GCGGCATTAC GTGCTGCAGA AGTTGAAGCA GATGTTATTT TAATGGGCAA AAATAATGTA 2520 

10 

GATGGTGTAT ATTCTGCAGA TCCTAAAGTA AACAAAGATG CGGTAAAATA TGAACATTTA 25 BO 

ACGCATATTC AAATGCTTCA AGAAGGTTTA CAAGTAATGG ATTCAACAGC ATCCTCATTC 2640 

~ TGTATGGATA ATAACATTCC GTTAACTGTT TTCTCTATTA TGGAAGAAGG AAATATTAAA . 2700 

15 

CGTGCTGTTA TGGGTGAAAA GATAGGTACG TTAATTACAA AATAAATTTA GAGGTGTAAA 2760 

ATAATGAGTG ACATTATTAA TGAAACTAAA TCAAGAATGC AAAAATCAAT CGAAAGCTTA 2820 

2Q TCACGTGAAT TAGCTAACAT CAGTGCAGGA AGAGCTAATT CAAATTTATT AAACGGCGTA 2880. 

ACAGTTGATT ACTATGGTGC ACCAACACCT GTACAACAAT TAGCAAGCAT CAATGTTCCA 294 0 

GAAGCACGTT TACTTGTTAT TTCTCCATAC GACAAAACTT CTGTAGCTGA CATCGAAAAA 3000 

25 GCGATAATAG CAGCTAACTT AGGTGTTAAC CCAACAAGTG ATGGTGAAGT GATACGTATT 3060 

GCTGTACCTG CCTTAACAGA AGAACGTAGA AAAGAGCGCG TTAAAGATGT TAAGAAAATT 312 0 
GGTGAAGAAG CTAAAGTATC TGTTCGAAAT ATTCGTCGTG ATATGAATGA TCAGTTGAAA . 3180 

30 AAAGATGAAA AAAATGGCGA CATTACTGAA GATGAGTTGA GAAGTGGCAC, TGAAGATGTT . . . .324 0 

CAGAAAGCAA CAGACAATTC AATAAAAGAA ATTGATCAAA TGATTGCTGA TAAAGAAAAA 33 00 

GATATTATGT CAGTATAAAA CTAATATACA ATGACATATT AAAATGCCAG TATTAAACGA , 3 36 0 

35 

TAATGTAACA TTTAAAATGG GCATGTTTAA TTAAATCAAA , GATGCATGTG ATAATTTAAA . . B , .3420. 

TTCACSvATGA GCATAAAAAT GGTGTTTAAA CAAGTTAATT AAACATATAC TTTATAAATA , 3480 

ATAGGCATTA GGTATATTGC TATAATAAAG TTATGTAATT TTTAACCTCA GTATGTATGT 3540 

40 

CACATTTCTG GTGTAAACTG TACCGAGTCA GACTTTGGTA CAGTTTTTTT ATTTGCTTAT 3600. 

TCAATGCATT AAATGAGTAT GATAAAATGA TAATGATTGT TTAGTAACTT . ATACTATATG 3660 
45 ACAGAGATGA TCAGGCTCGG AGGAAAGACC ATGTTTAAAA AGCTAATAAA TAAAAAGAAC "... 3720 

ACTATAAATA ATTATAATGA AGAATTAGAC TCGTCTAATA TACCTGAACA TATCGCTATT, 3780 

ATTATGGATG GTAATGGGCG ATGGGCTAAG AAGCGAAAAA TGCCTAGAAT TAAAGGTCAT . 3840 

50 TACGAAGtAT GCAAACAATA AAAAAAATTA CTAGGGTAGC- TAGTGATATT GGTGTTAAGT 3900 

ACTTAACTTT ATACGCCTTT TCCACTGAAA ATTGGTCAAG ACCTGAAAGT GAAGTAAA . 3958 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5333 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
5 (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 170: 

10 

ATTAAAACAA CTTAATATAC CTATTTATGG TGGTCCTTTA GCATTAGGTT TAATCCGTAA 60 

TAAACTTGAA GAACATCATT TATTACGTAC TGCTAAACTA AATGAAATCA ATGAGGACAG 120 

TGTGATTAAA TCTAAGCACT TTACGATTTC TTTCTACTTA ACTACACATA GTATTCCTGA 180 

75 

AACTTATGGC GTCATCGTAG ATACACCTGA AGGAAAAGTA GTTCATACCG GTGACTTTAA 240 

ATTTGATTTT ACACCTGTAG GCAAACCAGC AAACATTGCT AAAATGGCTC AATTAGGCGA 300 

20 AGAAGGCGTT CTATGTTTAC TTTCAGACTC AACAAATTCA CTTGTGCCTG ATTTTACTTT 360 

AAGCGAACGT GAAGTTGGTC AAAACGTAGA TAAGATCTTC CGTAATTGTA AAGGTCGTAT 420 

TATATTTGCT ACCTTCGCTT CTAATATTTA CCGAGTTCAA CAAGCAGTTG AAGCTGCTAT 480 

25 CAAAAATAAC CGTAAAATTG TTACGTTCGG TCGTTCGATG GAAAACAATA TTAAAATAGG 54 0 

TATGGAACTT GGTTATATTA AAGCACCACC TGAAACATTT ATTGAACCTA ATAAAATTAA 600 

TACCGTACCG AAGCATGAGT TATTGATACT ATGTACTGGT TCACAAGGTG AACCAATGGC 660 

in - 

AGCATTATCT AGAATTGCTA ATGGTACTCA TAAGCAAATT AAAATTATAC CTGAAGATAC 720 

CGTTGTATTT AGTTCATCAC CTATCCCAGG TAATACAAAA AGTATTAACA GAACTATTAA 780 

TTCCTTGTAT AAAGCTGGTG CAGATGTTAT C CAT AGCAAG ATTTCTAACA TCCATACTTC 84 0 

35 . . . 

AGGGCATGGT TCTCAAGGTG ATCAACAATT AATGCTTCGA TTAATCAAGC CGAAATATTT 900 

CTTAeCTATT CATGGTGAAT ACCGTATGTT AAAAGCACAT GGTGAGACTG GTGTTGAATG 960 

CGGCGTTGAA GAAGATAATG TCTTCATCTT TGATATTGGA GATGTCTTAG CTTTAACACA 1020 

40 

CGATTCAGCA CGTAAAGCTG GTCGCATTCC ATCTGGTAAT GTACTTGTTG ATGGTAGTGG 1080 

TATCGGTGAT ATCGGTAATG TTGTAATAAG AGACCGTAAG CTATTATCTG AAGAAGGTTT 1140 

45 AGTTATCGTT GTTGTTAGTA TTGaTTTTAA TACAAATAAA TTACTTTCTG GTCCAGACAT 1200 

TATTTCTCGA GGATTTGTAT ATATGAGGGA ATCAGGTCAA TTAATTTATG ATGCACAACG 1260 

CAAAATCAAA ACTGATGTTA TTAGTAAGTT AAATCAAAAT AAAGATATTC AATGGCATCA 1320 

50 GATTAAATCT TCTATCATTG AAACATTACA ACCTTATTTA TTTGAAAAAA CAGCTAGAAA 1380 

ACCAATGATT TTACCAGTCA TTATGAAGGT AAACGAACAA AAAGAATCAA ACAATAAATA 144 0 
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GCTTTTTCTT 


TATATATGAT 


GAGCTTGAGA 


CATAAATCAA 


TGTTCAATGC 


TCTACAAAGT 


1560 




TATATTGGCA 


GTAGTTGACT 


GAACGAAAAT 


GCGCTTGTAA 


CAAGCTTTTT 


TCAATTCTAG . 


1620 


5 


TCAGGGGCCC 


CAACATAGAG 


AATTTCGAAA 


AGAAATTCTA 


CAGGCAATGC 


GAGTTGGGGT 


1680 




GTGGGCCCCA 


ACAAAGAGAA 


ATTGGATTCC 


CAATTTCTAC 


AGACAATGTA 


AGTTGGGGTG 


1740 




GGACGACGAA 


ATAAATTTTG 


AGAAAATATC 


ATTTCTGTCC 


CACTCCCGAT 


TATCTCGTCG 


1800 


10 


CAATATTTTT 


TTCAAAGCGA TTTAAATCAT TATCATGTCC AATCATGATT AAAATATCAC 


1860 




CTATTTCTAA 


ATTAATATTT 


GGATTTGGTG 


AAATGATGAA 


CTCTTTGCCT 


CGTTTAATTG 


1920 


15 


CAATAATGTT 


AATTCCATAT 


TGTGCTCTTA 


TATCTAAATC 


AATGATAGAC 


TGCCCCGCCA 


1980 


TCTTTTCAGT 


TGCTTTCAAT 


TCTACAATAG 


AATGCTCGTC 


TGCCAACTCA 


AGATAATCAA 


2040 




GTACACTTGC 


ACTCGCAACA 


TTATGCGCAA 


TACGTCTACC 


CATATCACGC 


TCAGGGTGCA 


2100 


20 


CAACCGTATC 


TGCTCCAATT 


TTATTTAAAA 


TCTTTGCATG 


ATAATCATTT 


TGTGCTTTAG 


2160 




CAGTTACTTT 


TTTTACACCT 


AACTCTTTTA 


AAATTAAAGT 


CGTCAACGTA 


CTTGATTGAA 


2220 




TATTTTCACC 


AATTGCCACA 


ATGACATGAT 


CAAAGTTACG 


GATACCTAAA 


CTTTTCATAA 


2280 


25 


CTGCTTCATC 


TGTAGTGTCX GCAACAACCG 


CATGAGTAGC 


GATATCACTA 


TATTCATTCA 


2340 




CTCTATTTTC 


ATCATGGTCG 


ATGGCCATTA 


CATCCATGTC 


TAATGGATTG 


AACTCACGAA 


2400 




CGATACTACC 


TCCAAAACGA 


CCTAGACCGA 


TGACTACATA 


TTCTTTACCC . 


ATACTCGCCC 


2460 


30 


TCCATTAAAT 


GATTTTCATC 


AATTCATTGA 


AAATATAAAT. 


TTAAAATTAT 


TATAAATGAG , 


2520 




TACCCCAACT 


AAATTATCTA 


AATGCAGTAA 


TGCAAGTAAA 


TGAAAGTTGG 


GGTATCGTCT . 


2580 




CAACTT ATGA 


TTTCTTTCCT 


TCAACATATT 


CTTTGTCGAA 


AACAAATAAT 


CTTAATAATA 


2640 


35 


ATATTAACGA 


TGGAAGTAAT 


AAAAGTAAAC 


CTAAAATAAA 


GACAATCACT 


AATGTCCAGC 


2700 




CCACTTCTGG 


ATTAACATAT 


GCATCTGTAA 


TTTTTACAAA 


CGGATATAAA 


AGGTATGGCA 


2760 


40 


ATTTACTAAT 


TCCATAGCCA AAGAACGOGA ACATCATTTG TAAAATAACA AATACAAAAG 


2820 


CCAAACCATG 


TTTTTTCTTA 


AAGAATGTTA 


ACAATGAAGC 


TAATGCAAAG 


AATAAGAAAC 


2880 




TTATACCAAA 


CATCCACCAA 


TAGTCAAAAA 


CAGCTGAATA 


AAAATGTTCA 


GAATTTTGAA 


2940 


45 


TGCGTAATGA 


TAGAAATACG 


AATAAACAAA 


TGATAATCAT 


CGGCGGCCCT 


AAAAATATGT 


3000 




GCCATTGTCT 


TGTTAAATTA 


TATGCTGGTT 


CGTCATTTGC 


rrrrrrAGCA 


TAATATGTCA 


3060 




AAAATCCTGA 


TGAAATATAT 


AAAACTGAAA 


TAATTGCCAA 


GAATACTACA 


GACCAAGCAA 


3120 


50 


ATGGGCTTAA 


TAATAACTGC 


ACCCAATCTA 


GATCGATAAC 


ATTGTTTCGA 


ACATTAATAT 


3180 




AGCCACCTTC 


TGTAATAGTT 


AAAGCAGTAG 


ATAATGAAGC 


TGGAATTAAT 


AATCCACTTA 


3240 



55 



831 



EP0 786 519 A2 

AACTGTTTCT CAACGATATC ATAAT CAGTG CTATTGAACC TGGTATTAAC AATACCGTGC 3360 

CTAAATATTT GATTGACTCT GGAAAGAAAC CTACGAATCC TACGAAGAAG AAAACAAAGA 3420 

5 ATACATTCGT AACTTCCCAA ACTGGGTTTA AATAACGTGA AATTAAGTGA TTAATTTTCT 34 80 

TTTCATCACC AGTTAACTTT GAATGCAATG CGAAGAAACC TGCCCCAAAA TCTATAGAAG 3540 

CAATAATGAT ATAGCAAAAT AAAAACAACG ATAACACTGT TATACCTATA AATGCATAAA 3600 

10 . 

TCATTTTTCT ATTTCTCCTC CTTGCTTCTT GGCTAAACGA TTTACATCTT CATACGCCGG 3660 

TTTATTTTTA AACATACGAA TTAATACGTA TGCACATGTA TACATTAAAA TGATGTACAA 3720 

TATGCCAAAT AAAATTGTAA CGAaGGTTAT TCCGCCTGCT TGTGTTGCTG CTTCTGCCAC 3780 

GCGCATATAA CCACGAACAA TCCAAGGCTG TCTACCCATC TCTGTTAAGA ACCATCCAAA 3840 

TTCTATAGCT AGCATTGAAG CTGGGCCTGT TAATAATATT CCATAAAGCA TCCATTTATG 3900 

AGTAGAAAAC TTTCTAAGCT TTTTAAACAT TAAAGTTAAG ACATAAACAC CTGAAATGAC 3960 

20 

AAAACATAAA ATTCCCATCG TTACCATTAA ATCAAAGAAA TAATGGACGA TCATAGGCGG 4020 

ATGTAAACTT TTTGGAAAAT CATTTAACCC TTGTACTTTA GTTTTGACAC TATTATCTGC 4080 

2S TAAGAAACTC AATAGTCCAG GTAATTCAAT CGCACCTTTA ACTTGCTGAG TCTTTTCATC 4140 

TAACACACCA AATAATAATA ATTTGGCATG GGAAGATGTA TCGAAATGCC ATTCATAAGC 4200 

TGCTAATTTT TCAGGTTGGA ATTTATGCAA AAATTTTGCA GATAAATCCC CTGCCAACAT 4260 

30 AGAAAGTAAT GTTGAAAAGA ATCCAACTAT CATAGACATT TTCAAAGCTT TCTTATGGTA 4320 

GACAGTATCT TTAGGTTGAC GATTACGCAA TAATTTAAAA GCTGCTATTG ATGCAATAAC 4 380 

AAATGCCATC GTCATACCGG CTGTAGTAAT TACGTGAAAT GATCGAACTA TAAACGATGG 4440 

35 _ 

GTTAAAGATC GCTTCTATAG GTTGAACATT GACCATCTTT CCATTCTTCA ACTCAAAACC 4500 

TGCAGGCGTA TTCATAAATG AATTCACTGA AGTAATGAAG AATGCTGAGA AAGAGCCACG 4560 

AATAATTACT GGTATACTAA TTAAGAAATG TGTCCATTTA TTTTTAAAAC GATCCCAAGT 4620 

40 

ATATAAATAT ATACTTAAGA AAATAGCTTC AAAGAAGAAC GCAAATGTTT CCATAAATAA 4 680 

TGGAAGTGCA ATAACGTGTC CACCCATTTC CATAAATGTA GGCCAAATCA ATGATAATTG 4740 

AAGTCCTATA ATTGTACCTG TAACAACTCC CACTGCTACA GTAATTGTAT AAGCTTTAGC 4800 

45 

CCATCTTTTG GCCATAGCTA TATATTGAAG ATCATTTTTG CGAATACCTA AAAATTCTGC 4860 

AATTGCGAAC ATTAAAGGCA TACCAACACC AATCGTTGCA AAAATGATAT GAACTGCTAA 4920 

50 AGTCATAGCT GTCAAAAACC GACTGATTTC AACTGTATCC ATTTAAAAAC ATCACCTTTT 4 980 

TCTTTTTTTG ATGACAAGAC AATGAACTTA ATTATAATTG CTATAATGTG TATTTTTAAA 5040 
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GAATTTCAAT GTATAATTGT GTATATTACA TTAGAATAAA GCACGAAGGA GCATGATACA 5i 60 

TGTCAGAAAT AATCGTTTAT ACGCAGAATG ATTGTCCACC TTGTACATTT GTAAAAAATT 5220 

ATCTAAATGA GCATCACATT GATTTTGAAG AGAGAAATAT CAACAATCAA CAATATCGAA 5280 

ACGAAATGAT AGATTTTGAT GCTTTTTCAA CTCCGTTTAT TTTGTTGAAT GGC 5333 
(2) INFORMATION FOR SEQ ID NO: 171: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 11126 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 171: 

ATACGTGACC CTTTATCCGA AAATTTCTTT TCATATTCTG TTAAAATATT ACTGCCATCG , 60 

TCTTCTTGAT GTAAATTTAG ATTTATTTTT GTAAAATACA TTCCAAATTG AGACATACTT 120 

TCTAAACTGT AGGCAAATAG TCCTCTGTTA TCAGTTTTAA AATGTAAATC TCCTTCATCA. 180- 

25 TTTAAGATTT GTTGATACAA CGCTAAAAAC GTATGATACG TTAAACGTCG TTTTGCATGA 240 

CGATTTTTTG GCCATGGATC TGAAAAGTTC AAATAAATAC GCGAAACTTC GCCGTCTTTA 300 

AAATATTCAT TTAATTCAAT GGCGTCATTA CAAATAATCT , TTAAATTTGT TAAACCCATC 360- 
30 TCTTTAACTT TATCCAATAC TTTATAAACG ATACTTTTCT, CACGTTCCAT TGAAATATAG . 420- 

TTAATATGAG GATTTTGAGC AGCTAATGTT GTAATAAACT GCCCCATACC CGAACCAATT 4 80 

TCAATGTGTA TCGGTTGCGT TTTaTCAAAC CATTCAGTCA . TTTTCCCTGc ATGTTGACCG 540 

TCCATGTCAA CCAATTCAGG ATGATCTTTT AAATAATCTT. . CAGCCCATGG TTTGTATCGA . 600 

ACTCTCATAT TTTATTCTCC TCTTAAATAA ACATGTTACT ATTCATAACT TCATTTAGGA 660 . 

ATTTAAGCCA AGTGTTCATA TCCTTATATC TTTTTTGCTC TTCATACCAT TGAACAAGAC 720 

CTATAGATTG AATTACCGTA TACCATTTCA TACGTTTATT TAAATTCAAG CTCTCTTGAA . 780 

CACCATATGT TTCAAGCCAT TCAGACCATT GTTGTTGTGG AACATAGTTG TAAAGCAGCA . 840 

TTCCGATATC AATTGC CGGG TCTGCAATCA TTGCACCTTC CCAATCAACT AAAAATAGTT 900 

CATCTCGATC GGATAATAAC CAATTATTAT GATTCACATC ACCATGTACA ACAGTGAAAA 960 

AACGCGAATC TAAACTCGGT ATATG CTCTT CTAAATAGGT TAATGATTTT CTCACAATAT 1020. 

SO GATGTGTTAA AACTT CTCTT GATAAAGAGG CATTAATTTT ATTAAG CAT A ATCTCAGGAG 1080 

TAATAGGTTC CATTTC CAT A CGCTTTAACA TACTTAATAA AGGTCTAGAA TTGTGTATCT . 1140 
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TTTTCCAATG TTGTGCTGTA ACAACCTCGC CTGTTTCTAT GCGTTTCGTC CATACTAATT 1260 

TGGGCACAAT ACCTTCTGCT GATAATGCCG CAATAAATGG ATTTGAATTT CGTTTTAAAA 1320 

ACAACTTTTG TCCATCTTGT TCAGCCATAT ATGCTTCACC AGATGCACCA CCTGCTGAAT 1380 

CAAGTGTCCA CCCTAATTGA TAAAACTGCT CCAACTCGTC CACCTCACTT TCAATTAGAA 1440 

AATGGCTCTA GAAATAGGTT TTTCAAGAGC CATATATTCT AATTTATAAC ACCATACTGG 1500 

TACAAATATT ATGTCCAGAT AATTATTGTA AATCCTCAAC CAATGCCTAC ATTACACGAC 1560 

TAAATTTAAA TCGTAATGTC TGTCATTGAC ACCATACATT CTATAGTCAC TTACTTGACA 1620 

TATAATGTTA CCGTGTCTAA AACTACATGT TTTTGAATCT CTGTAGGCGA TAAACTcTAG 1680 

15 

TTTTCAAAAT AATTGCTATC CCATTTTCAT GGTTAGCATA AATTTATGAA CTGTAACATT 1740 

TACGTACTTA GTAAAATATG ATGCACATCA TATTTGTrAC TCATAGAAAA TTTTATAAtT 1800 

2 0 TTTATCATTA TATTTCAACT GAAAATGAGA AACAAAATGG CACTTTTTAC TAATATGTGT 1860 

TTTCTAAACA ACACTTTTAA GCTTCGTTTT AAATTATAAC ATAATTCACT TACGAAAGTT 1920 

GATAAATTTA AGTAATTTAA TCTAAAAATA TGATGAAAGA ATTTTAAATA CTGTGTGACT 1980 

25 CTATATACTT TTCAAATCCT TCTTGTAGTT GACGTGTAAT TGGGCCAACT TTACCATCAT 2040 

TAACTGGTTC ACCATCTAAT TTAATAACAG GTGTAACCTC AGCTGAAGTA CTTGAAACAA 2100 

TAACTTCATC TGCGTTTTTC AAGAAATCTA CAGTAAACGT TTCTTCTTTA AATGGGATGT 2160 

TATAGTCTTC GGCAATTTTT TTAATTACAA TTCGTGTAAT ACCATTAAGA ATATAGTTGT 2220 

TAATCGGATG TGTATAAATC ACACCGTCTT TAATTGCATA AGCATTACTT GAAGATCCTT 2280 

GAGTTACAGT TtCACCTCGA TGTTGAATTG CTTCAACTGC ATTATATTTC ACAGCATATT 2340 

CTTTPGCTAA TACATTcTCC TAATAAGTTC AAGCTTTTAA TGTCGCAACG TAACCATGGG 2400 

ATATCTTCAA CGGTAACACC ATTCACACCA TTTTCTAAAT GATCATAAGG ACGATCATAA 2460 

CTCTTTGTAT AAGCAACAAT TGCTGGTTCT ACTTCAGGTG TCGGGAAGCT ATGATTCCTT 2520 

TCAGCTACAC CACGCGTTGC TyGAATATAA ATTGCC CGAG TTTCAATTTG ATTCATATGA 2580 

ACTAATTTAC GAGATAGTTC AATTAATTCT TCTACAGAAT AATTTAAATC TAAACCAATC 2640 

45 TCATTGGCAC TACGTwAAAw TCTTTCATAA TGTTCTGTTA CTGTAAATAA CTTACCATTA 2700 

TATACTCGAA TGTATTCATA AATAC CAT CG CCAAATACGT ATCCTCTGTC GTTGTATGAA 2760 

ACCTTTGCTT CACTTGGACT TACAAACTCA CCATTTAAAA AAATTTTTTC CATATATTAT 2820 

SO TCCTCCACGC ATAATGAATA AATTGCTTCT AAGTAAATAC TAGTTGCGTT AAATAACTGT 2880 

TTTTTAGTGA TATATTCATT TTTCTGATGC ATTAAATCTT CAGAATCACT AAACATTGCG 2 94 0 
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TCAGTGATAT CATTTGTTTG 


ATTTCTATAT 


GCAGTAACTA 


ACTTTTGTAC 


AAAAGGATCA 


3060 




TTTTTATCAA 


CATAATGTGG 


TGGTTGGACT 


TTACCTAATT 


TCACTTCAAA 


GCCATATTGT 


3120 


5 


TGAATCTCAT 


TTGCAAAACG 


ATCCATAGCT 


TTTTCAAATT 


CAAATCCTTC 


TGGGTAGCGT 


3180 




" AAGTTGATAC 


CGAAAAGACC 


TGCGTTTTCA 


TTATCATATG 


TAATAACACC 


AATGTTAGTT 


3240 


10 


GTCACGTCAC 


CCATGACATC 


TGTATGGAAT 


TTCATTCCCA 


TCTTTTCACC 


AAAATCTGAA 


3300 


TTAAATAAGT 


AGCGATTACT 


AAATGCTACA 


AACGCTTGTG 


CATTATTATC 


AAGATTTAAT 


3360 




GATGCTAAGA ATTTTAGTAA 


GTAAAGACCC 


GCATTCACAC 


CGATAGATGG 


ATCCATACCA 


3420 


15 


TGAACCGCTT 


TACCTTCAAC 


TGTTAAAACT 


AGAATGCCAC 


TATCAACAGT 


ACTATCACCT 


3480 




TGTAAATGAT 


TTTGTTCTAA 


AAAGTACTCA 


AAGTCTTGAA 


TAACATCTGT 


CATATTTTCT 


3 54 0 




TTAACAAGCA 


CTCTTGCTTC 


TGCATGATCA 


GGTACCATGT 


TGTAACGTTC 


ACCAGATTTA 


3600 


20 


AAAGTTATTA 


ATTCATAATC 


AGGTTCATCT 


TGAT CTTCAG 


TAAGTTTATT 


TTGAACTAAA 


3660 




TCAAATGTTG 


TAATGCCTTT 


TTCACCATGA 


ATACATGGAA 


ATT CTGCATC 


TGGTGCAAAA 


3720 




CCTAATGTTG 


GCATTTCTTC 


TGTTTTAAAA 


TAGCGATCCG 


TACATTTCCA 


ATCAGATTCT 


3780 


25 


TCATCCGTAC 


CAATAATCAT 


ATGAATACGT 


TTCTTCCAAT 


CCACATTCAT 


ATCTTCTAAT 


3840 




ATCTTAATTG 


CATAATAAGC 


AGCAATTGTT 


GGAC CTTTGT 


CATCAAGTGT 


ACCTCTAGCT 


3900 




ATGATAGCAT 


CTTCTGTTAC 


AACCGGCTCG 


AACGGATTAC 


TATCCCATCC 


ATCACCAGCA 


3960 


30 


GGAACAACGT 


CAACATGACA 


TAAGATACCT 


AATACGTCAT 


TTCCTTTACC TGCCTCAATT 


4020 




CTTCCTGCAA 


TATGATCCAC 


ATCATGTGTT 


GTAAATCCAT 


CTCTATGTGC 


AATTTCATAC . 


4080 


35 


ATGTAGTCTA 


ATGCCTTACG 


AGGACCTGGA 


CCAACTGGTG 


CGT CTTCTGA 


TGCTTTTGCA 


4140 


TCATCTCTCA 


CACTTTCAAT TGCTAATAAT 


CCTTTTAAGT, 


CATTAATGAT- 


TTGATCTTCG 


> 4200 




TATTGTTGAA 


CTTTTTCTTT 


CCACATTCGA 


AATCGACTTC 


CTTTTTTCTA 


TAAGTTAAAT 


4260 


40 


TCTATTTTAC 


ATGAAAAGAT 


ATAAAAACTA 


CAATAAGATG 


TCAGAAAATA 


ATAAAAAGGA 


4320 




ACAAAACGAT 


GCTATTGATA 


TGACACAAAT 


CATAAATAGC 


TGCTTTGTTC 


CTTTTTTAAT . 


4380 




TTATATATTT 


AAAATACACA 


TATTGAAGAG 


CTCGAGATAT 


AAGTCAATGT 


ACTAGGCACA 


4440 


45 


CAATTTAATA 


TTGACAGTAA 


TTAACCGAAC 


GAAAATGCG C 


CCCGGGGCCC 


CAACATAGAG 


4500 




AATTTCGAAA 


AGAAATTCTA 


CAGACAATGC 


AAGTTGGCGG 


GGCCCCAACA 


TAGAAGCTGG 


4560 




CCAATAGTTA 


GCTTTCAATA 


ATGTG CAAGT 


TGGGGTAAGG 


GCCCCAACAG 


AGAAGCTGGC 


4620 


SO 


CAATAGTCAG 


CTTTCAATAA 


TGTGCAAGTT 


GGGGTAAGGG 


CCCCAACACA 


GAGAATTTCG 


4680 




AAAAGAAATT 


CTACAGACAA 


TGCAAGTTGG 


CGGGGCCCCA 


ACACAGAAGC 


TGGCCAATAG . . 


4740 
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TAAAGAAATA CGTTTTCTTT AGATATTAGT ATTTCTTATG AATGAGTTTC ACGCATGTAT 4860 

TCTTCTTTCT ATATGCATAT TAGCTATGAC TAACGATAAA GAACCTGAAA CACTAATAAA 4 920 

5 TGTCCTATAG TTTACAATAT TATATTGGCA GTAGTTGACT GAATGAAAAT ACGGTTGTAA 4980 

CAAGCTTTTT TCAATTCTAG TCAAGCTTGC "CGGGGTGGGA CGACGAAATA AATTTTGCTA 5040 

AAATATGATT TCTGTCCCAC TCCCTTATCA TTTCTGTCCT ACTCACATCT TATTCTTTAT 5100 

10 

CAGATAATGC ATTTTTATTC TTTTTTAAAT CTTCTTCAGT GACGATACGT AAATTATTAT 5160 

TTGGTGTGCG CCACCTTCAT CATCAAATTT ACCTTTTTCA ATACTTTCGT CAGTCTTATT 5220 

GTCATATTCG GTAAATTTTG ATTTTTCTTC TTTGAAAAAT GCTTTTGGAT TATTTTTTAA 5280 

15 

TCTATTAGCA TATT CTTTCG GATTTGTTTT TACTTCTTTA ATTGTTTCAT TAGCAATTGT 5340 

TCCTAATTGC GTCGCTTTAT CCTTAGCATT ATCTTTATAG CTTTGAGGAT CTTGTTTATA 5400 

2Q TTTATTATAT TCcTGcTTTC AGCTTGTCAC GACTATCTTT ACGTGTAACA AGTACAGCTG 5460 

CTACAGCGCC ACCTATACCT AAAATCGCTT TAAATAAATT ACCTTTTGCC ATATCAATCG 5520 

TCTCCCTTTT ATTTATAATT TAATTTGTCA AAATCATTTT CAGTTAATAA ACGATATTCT 5580 

25 CCTGAATCTA AATTGCTGTC CAATTCTAAA TCAGCAATTT TGATACGTCT TAAATGTAAT 5640 

ACCTCATTTT GAATGCTATG AAACATTCGT TTAACTTGAT GATATTTTCC TTCATAAATT 5700 

GTTACGTGTG ACGTTTGATT ATCAATATAA GTTAATATTG CAGGCTTAAC CTTGCCATCA 576 0 

30 GTCAGTGTtA CACCCTCTTT AAAAGCTTGA ATGTCGTCTT CAGTGATAGG ATTTGCTGAA 582 0 

ATAACTTCAT ATTTTTTAGA AACATGTTTG TTTGGACtCA TTAATTCATG ATTAAAATCA 58 80 

CCATCATTCG TTATCAATAA AAGCCCTTCT GTATCTTTAT CAAGACGAGC AACCGGAAAA 5940 

35 ■ * 

ATATTTAGAT GTTGGTATTC AGGTATTAAA TCAATAACGG TTTTTGAATG ATGATCTTCA 6000 

GTTGCTGATA TATAACCTTT TGGCTTATTT AACATAATAT AGACATTTTC AATGTATTCT 6060 

ATTAATTCTC CACGAACTGT TATCTTATCG TTTTCTGGTT CTATATGTGT TTTTGGTGAT 6120 

40 

TTAATTACTT GTTCGTTGAC ATTTACAAGG CCTTTTTTAA GTAACTGTTT GACCTCATTA 6180 

CGTGTACCGA CGCCCATATT TGCTAAAAAT TTATCTATTC TCATCGTAAA AACCTAACTC 624 0 

TACGTCTTAA TTTTTCAGGA ATTTCACCTA AGAATTCGTC CGCAAGACGC GTTTTAATTG 6300 

45 

■ TGATTGTACC GTAAATTAGA ATACCTACTG TAACACCTAA AATAATAATG ATTAAGTAAC 6360 

CAAGTTTAGT AGGTTCTAAG AATAGATTTG CAAGGAAAAA TACTAATTCT ACACCTAGCA 6420 

50 TCATAATAAA TGAATACAAG AATATTTTTG CAAAATGAAT CCAACTATAG CTGAATTTAA 64 80 

ACTTCG CAT A TTTTTTAAGA ATATAGAAAT TACATCCAAT TGCAAATAAT AATGCGATAC 6540 
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ACTTGATAAC TACAGAAGCT AAAATAACAT AAACTGTTAA TTTCTGTTTA TCTATACCTT 
GTAACATTGA TGCCGTTACA CTTAATAGTG AAATTAGTAT TGCTACAGGC GCAT AAT AG A 
ATAATAAGCG ACTACCATCA TGGTTAGGGT CATGACCTAA AACAATTGGA TCGTAACCAT 
AGAAAACTGT GAATAATGGT TGTGCCAAGG CCATAATTCC AATACTAGCT GGAACAGTTA 
TAAACATTAA TACACCAATA GATGTTCTAA TTTGATGATG CATTTCATGT AAGCGACCTT 
CTGCAAATGT TTTTGTAATA TAAGGAATTA AACTCACTGC AAAACCAGCA CTTAATGATG 
TCGGAATCAT TACAATTTTA TTAGTTGACA TATTTAGCAT ATTAAAGAAT ATATCTTGTA 
ACTGTGAAGG TATACCAACT AAAGATAAAG CACCGTTATG TGTAAATTGA TCTACTAAGT 
TAAATAATGG ATAATTCAAA CTTACAATAA CGAACGGTAT ACTATAAGCA ATAATTTCTT 
TATACATCTT GCCATATGAC ACATCTATAT CTGTGTAATC AGATTCGACC ATACGATCAA 
TATTATGCTT ACGCTTTCTC CAGTAATACC AGAGTGTGaA TATACCAATA ATCGCACCAA 
CTGCTGCTGC AAAAG TAGCA ATACCATTGG CTAATAAAAT AGAGCCATCA AAGACATTTA 
GTACTAAATA ACTTCCGATT AATATGAAAA TCACGCGTGC AATTTGCTCA GTTACTTCTG 
ACACTGCTGT TGGCCCCATA GATTTATAAC CTTGGAATAT CCCTCTCCAT GTCGCTAATA 
CAGGAATAAA GATAACAACC ATACTAATGA TTCTTATAAT CCAAGTAATA TCATCGACTG 
ACCAACCGTT TTTATCATGA ATGTTTCTAG CTAATGTTAA TTCAGAAATA TAAGGTGCTA 
AGAAATACAG TACCAAGAAA CCTAAAACAC CGGTAATAOT CATTACAATA AAACTCGATT 
TATAAAATTT CTGACTTACT TTATATGCCC CAATAGCATT ATATTTCGCA ACATATTTCG 
AAGCTGCTAA TGGTACACCT GCTGTCGCAA CTGCAATTGC AATATTATAT GGTGCATAAG 
CGTATGTGAA CGGCGCCATA TTTTCTTGTC CACCAATTAA ATAGTTGAAT GGAATGATaA 
AAAGTACGCC CAATACCTTG GTAATTAATA TACTAATGGT AATTAAAAAG GTTCCACGCA 
CCATTTCTTT ACTTTCACTC ATTACGAATC TCCCTATCTC ATGTTTATTA AAGTTTTGTA 
AACTAAAAGC TGTTTCTCTG TAAAATCATT TTTCATTATT ATGAATATAT CAGAAAACTT 
TATTTCATTG TCGTATATTC AATGAATTAT CATAACAAAA TTATCAACAC ATTGTCATTG 
AATACTAGAT TTTGATTAGA ATATTACGAA ATTTCATATA AACATTATAC TACTATTTGA 
GATGAACATC GCATAACAGT AGAAAAATCA TTCTTATCAT ACACATACAT CTTCATTTTT 
TATGAAGTTC ACATTATAAA TATATTCAAC ATAATTGTCA TCTCATAACA CAAGAGATAT 
AGCAAAGTTT AAAAAAGTAC TATAAAATAG CAATTGAATG TCGAGTAACA AATTTGGAGG 
AAGCGTATAT GTATCAAACA ATTATTATCG GAGGCGGACC TAGCGGCTTA ATGGCGGCAG 
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GTAAACTCAA AATATCTGGT GGCGGTAGAT GTAACGTAAC 
AAATTATTAA GAACATTCCT GGaAATGGGA AATTTTTATA 
ATAATGAATC CATCATAGAT TTTTTTGAGT CTAGGGGTGT 
ACGGGCGTAT GTTTCCAGTT TCCAACAAAG CACAAGACGT 
CTATCGAACG CCAACATGTA ACGATTAAAG AAGAAGAAGC 
ATACAGACCA AACTTTCACT GTACATACTC AAAATAATAG 
TGATTGCTAC AGGTGGTACA AGTGTCCCTC AAACTGGTTC 
TCGCACAAGA TTTAGGTCAT -ACCATTACTG AGTTATTCCC 
CAGCTGAACC TTTCATCAAA TCCAATCGTC TAAAAGGTTT 
TGTCAGTACT TAAGAAAAAT GGTAAAAAAC GCATCAGTCA 
CTCATTTTGG TATCAGTGGT CCAGCTGCAT TAAGATGTAG 
AAAAAAATCA AAAGACACAG CACATTTCTA TGGCAATCGA 
ATGAACAATT AAAACAACAC ATCACATCAT TATTATCGGA 
AAAACAGTTT GCATGGTCTA ATTGAAGAGC GCTACTTACt 
GAATCGATGA AAATACCACA TCACATCACT TATCAAATCA 
ATATGTTTAA AGGGTTTGTA TTTAAGGTGA ACGGGACATT 
TCACAGGTGG TGGTGTGTCA CTTAAAGAAA TTCAACCTAA 
TTCCGGGATT ATTTTTATGT GGTGAAGTAT TAGATATACA 
ATATTAGAAG TGCACTCGTA ACAGGACATG TGGCTGGATT 
ATGCATCAAT GGAATAATAG TATAAAATTT GGTTCX3ATTC 
TCATTCAAAT AAAAATGACC TTAATATAAC TGAGTCACTA 

GTCATTTCGT taattatgat tctttttcgt ttttagtacg 

CACCTGTAAT CAGTGCAAAT TCTTTCAATG GTAAATCCAT 

GAAGTTCTTT TTCAACTTTG cgcgattcat gtgtctcttc 
CTTTTGGAGC TGGCTGAATT TCTTTTGGTG ATACTTTCGT 
TTGCTAAAAT TTCATCAACA ATGAATTGCG TGTGTTGTTT 
CTTCATGAAT CATTCTATTG CCATCTGCAA CATATTGATC 
CTAATTGTTC TGGTGTTGCG ATCGCTTTGA ATTTCGCATA 
CAATTCGCAG TAAGCTATTT . TCTTTTTCAG TAATTACTGC 



TAATCGATTA CCATATGCTG 8460 

TAGTCCGTTT TCAATTTTTG 8520 

TAAATTAAAA GAAGAAGATC 85B0 

GGTTGATACA TTAGTGACAA 8640 

TGTTAGTAGA ATCGAAGTTA 8700 

TTATGAAAGC CATTCGCTAG 8760 

AACTGGTGAT GGTTATAAGT 8820 

GACCGAAGTT CCAATTACAT 8880 

AAGTTTAAAA GATGTTGAAT 8940 

TCAAATGGAT ATGTTATTTA 9000 

TCAGTTTGTT TATAAAGAAC 9060 

TGCATTTCCT GAATTAAACC 9120 

CACAGCAGAT AAAATCATTA 9180 

GTTCATGCTG GAACAAGCAG 9240 

ACAATTGAAC GACTTAGTAA 9300 

ACCTATAGAT AAGGCATTTG 9360 

AACAATGATG TCTAAATTAG 9420 

TGGTTATACT GGTGGTTATA 94 80 

ATATGCCGGA CATTACTCAC 954 0 

TCTTTAGTAG ATCAACTTTT 96 00 

AAAAGTGTCG TTATATTAAG 9660 

TCTTCTAGCT AACAAAGCCG 9720 

TCCTTCAGAA CCTGTATTTG 97 80 

TTTTTTAATA GGCGTACAAA 9840 

CGCTTCAGCT GGTAATTTAA 9900 * 

GATGTCATTT AATGTCGCAT 9 960 

AATTAATACT TTTACTTTAG 10020 

TGTTTGTTGA GCAATGTTAT 100 80 

TTCTATATCG CTTAATGCAA 10140 
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CATCCATTTG TAATTTTAAA GCAGTTATAG CTTTTAATGC ATCAGCCTTA TTACGATTAC 
TTACTTTTCG ATAATTTTX3C ACTAAAGCAG TGACGCGTGC AAGATCATCA TTAATCGTTT 
TTTCAGCATC TGGCTTTTTA ATAGGATGTA CATCTAAATC. ATGTATTGTT TGTAGATTTA 
ATGATGCTGT TTTATCAACT TGTGCATTGC TACGATCTTG ATCAATTTGT CCAATAGCAG 
TGTCATAAAT ATTTTGTAAC TGTGCTAATA TACTATTTCT TTCTTCTACC GTTGCTTGAA 
TATTCGCTTC AATTGCTTGT TTTTTATCGT TGAATAATGT TGTCAATTGT TCTCGAGCAG 
A03CCTTTCT GTTAATAACA GGTTCGATTT CACGAATTTG GTTTTTCTCA TCATGCAATA 
AATATGCCAC ATCTGCATTA GTCACTGCAC TAGCAATTTG TTGTTTAGCT TTAATTAACT 
CTTTTTCAAC TTGTGCTATT GCAATATTTT GTTCTTCATC TGTCGCTTCG TTATTTGCTT 
TAATTAAATT AATTTTATTT GTAGCGATAT TTTGAATTTG TTGTAATGCT GTTGCTTTAA 
CTGTTGTCGG TGGTTTAATT TTTGAAATAA TATTTTGAGC ATTTATACTA TCTTGATTAA 
CTTGGGCAGT CTTATCTGCA TGATTGATCT GATCAATAGC CTGATTAAGT GCTTGTTCTA 
CTAAATGTTT AGCAGCTAGT CTTTCTTCTT CAGTTGATAA ATCGCTTTGA TCGATTAGTG 
CATTTTGAGC TTCGGCTTTT ACACCAACAG ATTGACGCGC TGCTGGTTTA ACTTGAACTT 
TAGGTAAAAT CACTTTGATG TTGTCGTTGC CATCAGTCnC AGTnCGATCC ACTTCTGCAT 
TCGTTTTGTT TTGTGCAATG TCATTT 
(2) INFORMATION FOR SEQ ID NO: 172: 

( i) SEQUENCE CHARACTERISTICS :. 

(A) LENGTH: 3660 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 

(D) TOPOLOGY: linear ... 



10260 
10320 
10380 
10440 
10500 
10560 
10620 
10680 
10740 
10800 
10860 
.10920 
10980 
11040 
11100 
11126 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 172:. 
TTGCCCCGCA CGGCGGTGTG nTTCCTAGAA ATAATGAATA TAAAGaGAAA TATATAACAA 
CGATTTTGAA TTATGAACCT GGTGATATCG TTACAATCAA ACGTGTGAGA GATAAGACCG 
ATTTGCTAAT ATATTTGTCT AGTAAAGATA TTTCTATTGG TAATGAAGTG GAAATTGTAT 
CGAAAGATGA AATGAATAAA GTAATTATCA . TTAAACGTAA TGATAATGTA ATTATTGTCA 
GTTACGAAAA TGCAATGAAC ATGTTTGCTG AAAAATAAAA TAAAGAAGCC ATAAAGATAT 
CCATGATTGA ACTGATAAAG ACATATGGAT AATTGCTTTA GGCTTCTTTT TTATTAGTTA 
ATTTATCAAG TGAGTATATT TGAGTAAAAT ATTCACTGCA . TAAAGATTGA AGATAATCCA 



60 
120 
180 
240 
300 
360 
420 
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CTGTGGACTC GGACGCTGGA AAGTCAATTT AGCAATCGTC CAACTAGATT GTAGAACTTC 540 

GCCTAATAAT ACACCTAAAA TATATTGATA ACTCATTGTG ACAAGTAGTT GAATTTCTAC 600 

TATATTTTCA TCTTTTAATA TAAAATACAA CATGATAGAA ATTAAAGTTA TAACAACAAT 660 

GGGTGAGCCT TTTCtAGATG TTAAAATTAA AAAATAAATA AATATCAATA AATAGGTAAA 720 

TATAAAGAAA CTAGGTATCT GATAATGGCT CGACGCTAAA CCTATCAATA ACATAATAGG 780 

TGGCATAAAA TAACCACCAA TCGTTGTAAG CCATTGGCCT GCTAGATGTC TAGATTGTGT 84 0 

AATTGCGAAT CCTTGTTGTA ATGTCTGTTG TCGCTCTCGT GGACTTGTTA CAATGACTAA 900 

ATCTTTTGCA CGGCCACCAG CGAGTTTATT AAACAGTACA TGACCAAATT CATGTGTTAA 960 

AACAGGGATA TAGTTTAAAA TGACATCTAA ATAGTTCAAA ACAGGCTTAT GTCTATATTG X020 

ATGAATAGCA ATATAACAAG CTGCAACAAT AACGATAATG TATATATTAA GTTGAATTGT 1080 

CGTATTAAAA AAGTTTGATA AATAATTCAT TGTTAACCTC ATATAAGATA TTAATTTAAA 1140 

GTTTGCTTAT CACTTATTAT AAATGATATT GGCATCAATA GCGTTAGACT TTAGACTTAC 1200 

CTTAGTTAAA CTAATTTTAA TTTTTGAAAA GGTGAATATG TGTTAAAATA AAGCAAAATC 1260 

ATTTCG ATAT AAATAGGATG AATATAAATA CTGTTAATAT TGATTACACT AACATAATAA 1320 

TGAAATAAGA TAGGAGATTC CTGTTATGAC TGTTGAAGAA AGATCCAATA CAGCCAAAGT 13 80 

TGACATTTTA GGGGTCGATT TTGATAATAG AACAATGTTG CAAATGGTTG AAAATATTAA 1440 

AACCTTTTTT GCAAATCAAT CAACGAATAA TCTTTTTATA GTAACAGCCA ACCCTGAAAT 1500 

AGTGAATTAC GCGACGAGAG ATCAAGCGTA TTTAGAGTTA ATAAATCAAG CGAGCTATAT 1560 

TGTTGCTGAT GGGACAGGAG TAGTCAAAGC TTCGCATCGT TTAAAGCAAC CTCTAGCGCA 1620 

TCGTATACCT GGTATTGAGT TGATGGATGA ATGTTTGAAA ATTGCTCATG TAAATCATCA 1680 

AAAAGTATTT TTGCTAGGGG CAACTAATGA AGTTGTAGAA GCGGCACAAT ATGCATTGCA 174 0 

ACAAAGATAT C CAAACAT AT CGTTTGCACA TCATCACGGT TATATTGATT TAGAAGATGA 1800 

GACAGTAGTG AAcGnAnTTA AACTGTTTAA ACCTGATTAC ATATTTGTAG GTATGGGATT 1860 

CCCTAAACAA GAAGAATGGA TT ATG ACACA TGAAAACCAA TTTGAATCTA CAGTGATGAT 1920 

GGGCGTAGGT GGTTCTCTTG AAGTATTTGC TGGGGCTAAA AAGAGAGCGC CTTATATCTT 198 0 

TAGAAAAtTA AACATTGAAT GGATATATAG AGCATTAATA GATTGGAAAC GTATTGGTAG 2040 

ATTAAAGAGT ATTCCAATAT TTATGTATAA AATAGCCAAA GCaAAAAGAA AAATAAAAAA 2100 

SO GGCGAAATAA TCATGATGAG AAAAATAAAA CCGAGGAAAT CCTTAAATGG AGATTCTCGG 2160 

TTTTTTCGGT TTATTTAATA ACGAAGCGGG ACTCATCGAG TTTGTTTCTA AATTCTTTTT 2220 
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CATCAAGTTC ACCGTAATCT TTTAACTTTC CGCCTTCAAT CCAAGCAATC TTAGTACAAA 234 0 

ATTGTCTCAC TTGTCCTAAG TTATGACTAA CGAAAAAGAT GGTTTTGTTT TGCTCTTTAA 24 00 

ACTCGTAAAT TTTATCTAAA CATTTTTGTG CAAAAGTTTG GTCACCTACA GATAAAGCTT 2460 

CGTCAATGAC TAAGATATCT GGATTAACTG TGATATTAAT TGAAAAACCA AGTTTTGCAC 2520 

GCATACCACT TGAATACTTT TTAACTGGTT GATAAATAAA CTCACCAAGT TCACTAAATT 2580 

CAATAATCTT AGGTGTCATC GCTTTAATTT CTTTTCGCTT AAAGCCCATA CATAACATTT 2640 

TAAATTCGAT ATTTTCAATC CCTGTAAGTT GTCCACTCAA GCCAGCACTA ATTGCGATAA 2700 

^ GGGTGACTTC ACCATTACGA TCCACTTTGC CAACAGTAGG CGACAAAGAA CCGCCAATGA 2760 

TATTGCTCAA CGTTGATTTG CCGGAACCAT TGATGCCAAC AAGCCCTATG ACGTCACCTT 282 0 

CATATGCTTT TAAACTAATG TCATCTAAAG CGAAAAATGT TTTGTTTTTA TGTTTGGGAA 2880 

20 TGAGCGCATC TTTCATACGT TCTTTATTTG TACGATAAAT ACGATATTCT TTTGTTACAT 294 0 

TTTTAATGTT TACCGAAACG TTCATTTGTA GACCTTCCTT ATTCACATTT ATCTAGATTA 3000 

TAATATACTA CTCAACAGTT GTTAAATTTT AAAACCTGTT GTAAAGTGTA TAGAAGATTT 3060 

25 TGTTATTATC AGAGTGGGTG TTTTGACACA AAATGTTAAT CATCAATGAT AACAATGATA 312 0 

TTTAAAAACT AAACTTATTT CAACTTACAT GATTGTATAC TATAATGTAT TTGTAATAAA - 3180 

CTAATATTTT AAAGAACTAG ACAATAATTT TGATAGCATC CATGTATAGT GATAGTATTT , 3240 
ACAACAATTA TTATAATACT ATTTAGTTAA GTAGAGAAAT AGTTAAACAT TTGAAAGTGT ' - ' 33 00 

GGTTTAATGG AATGTCAGCA ATAGGAAGAG TTTTTAAAGA ACATGTAAAG AACTTTTATT 3360 

TAATTCAAAG ACTGGCTCAG TTTCAAGTTA AAATTATCAA TCATAGTAAC TATTTAGGTG 3420 

TGGCTTGGGA ATTAATTAAC CCTGTTATGC AAATTATGGT TTACTGGATG GTTTTTGGAT 3480 

TAGGAATAAG AAGTAATGCA CCAATTCATG GTGTACCTTT TGTTTATTGG TTATTGGTTG 354 0 

GTATCAGTAT GTGGTTCTTC ATCAACCAAG GTATTTTAGA AGGTACTAAA GCAATTACAC 3600 

AAAAGTTTAA TCAAGTATCG AAAATGAAcT TCCCGTTATC GATAtACCGA CATATATTGT 3660 
(2) INFORMATION FOR SEQ ID NO: 173: 

45 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13868 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 
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ATTAATCACT TGTTGTGTAG AGTCTTGTCC GTTTTGGTTA TGATTGTTAG CCATGATATA 120 

CCTCCCTTAC AACACTCGTG GACCAGAAGT TTTCTGATCT CTCACATTAA CTTCTAACTT 180 

5 ACGTACTGGC ATTTCTGTGA AATATTCTAC ATTCTTTTTA ATATCCGAAC GAATTGCTTC 240 

AGTTAAAGAT TGAACTTGAA CATTATTTGG TACGAAAAAG TCAGTTTTAA TGTCGATATA 3 00 

AGATTTATTT TTTTTGTTAT ATAGTTTCGC AACTACATTT GGTTGTCTTA CTTGATCATA 360 

10 

TTTTGCAACC GTATCGAATG CCGTCTTTTC AACAGCTTTA CGAGATACGT AAACATGACC 420 

AT CATCGAAG TCTTTGTATA ATCCAGGTTT TCGATGCGTA GGTTTGAAGA TACTAAATAC 480 

TAATATAAGA CCTATTAATA TCAATAGTGC AGCAAGTGAA ATAAGTAATG GTTGGAACCA 540 

15 

TTCAAATTGA AGGAAGTAGT CTTGATATTC AGTTATACGT CCATCTTGGA TATACATGAA 600 

TAACAGGAAC CCCACGaTTA CTACTATTAA TAAGCCAAGG ATAAAGTTTT TAAGTCGTTT 660 

20 CACCGCTAAC GACACCtCCT TAGTTAAAGf TAATTTAAAA ACATATTAAA TATGTACCCA 720 

TCAGTTTTTT TCTTAAACAT AATAAATTAA TAACTTTAAA TTTATTTTTA ATATATAAGA 780 

TGAAGTACCA TTTAGTAATA TATTCCCTAG TTTTTGTAAA TAAAACCTCA TTATTAATTA 840 

25 ATTyJCGTCA ATATGTTTTG AAGAACGATA TTCTAAAATA TCTGGGTCAC GATGTTTAAT 900 

TAAAACCTTA TTACTATTTC TCGGTTTCTC CTCACTCAAA GATTTTATAA GCGACCATAT 960 

CATCGCTATA ATGACCACGG AAAATGGTAA CGCAGCAATG ATTAATAAAT TTTGAATTGC 1020 

30 TTGAGTACCA CCTGTGTAAA TCATGATGAT TGCAAATAAT GCCATAATGA TACCCCAACT 1080 

CACTTTGACA AATGAGTTCG GATTAATATG ACCACTTGAA CTCAAGATAC CTAAAACATA 1140 

AGTTGCGGAA TCCGGTGATG TAACAAAGAA AATCATAATA ACAAGTAAAG TAATTAAGCT 1200 

35 

TAATACAAAA C CT AGCGG AT AATGTTGTAG CGTCGCAAAA GTTGCTGTTT CTGTCGCAGC 1260 

tttaScaata TCGGCAATAT GATTATCTTG TAAGTAAATT GCTGACGCGC CGAATACCGC 1320 

AAAGAATATA AAGCAAACTA ACGCCGGGAC AAAAAGTACA CCTAGAATAA ATTCTTTAAT 1380 

40 

CGTACGTCCT TTTGACACAC GTGCAATAAA TATACCTACA T^ATGGTGCCC AAGATATCCA 144 0 

CCATGCCCAG TAAAAGATTG TCCAATTTTG TAACCATTGG AATTTTTGAC CACCTGTCGG 1500 

45 AATGCGTAAA CTCATACTAA AGAAATTTGC AATATAATTA CCTAGACCAT TCGTAAATGT 1560 

ATTTAAAATG TATAGCGTTG GCCCAACAAT AAAAAGACCA ATAAGTACTA GAAAAGCAAG 1620 

TAACATGTTG ATATTACTCA ACGTTTTGAT ACCTTTATCG ATACCTGACC ATGCTGACCA 1680 

50 AGTAAATAAT ATGGTTGCAA TGACAATCAA GATTACTTGC ATCGTGAAGT TACT CGGTAC 1740 

ATTAAATAAA AAATGTAAAC CTTCGTTTAT TTGCAATGCA CCGAAACCTA ATGTTGCAGC 1800 
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CATTGCCTTT TCACCTAATA AAGGCGTGAA TGTAG CGCTG ACTAAGCCAG 


GATATCCTTT 


-1920 




ATGAAAGCTA AAATATGCAA ACACTAGCGC GACAATACCA TAGACTGCCC 


ATGCATGAAT 


1980 


5 


CCCCCAATGG AAAAATGAAA ACTGCATTGC ATCATTAATT GCAGATTGCG 


TGCCAGCTTT 


204 0 




ATGAATAGGC GTTAATTTGA AGGCATGACT GATTGGTTCT GCCGTTGTCC 


AGAACACAAG 


2100 


10 


TCCTATTCCC ATACCAGCAC TAAATAACAT AGCAAACCAA GACGGCAATG 


AGAATTCAGG 


■* 2160 


ATCTTCGCCT TCTTCACCTA ATGTAATGTT TGCGTATCTC GAAAATAAAA 


TATACACACA 


2220 




GACAAAT AAA ATAACTAAAA GGAGCAATAA ATAATACCAA GAAAAATGTA 


GCGCAATAAA 


2280 


15 


TGTAGTAATG TTTTGCGTGA GTTTTTCTAA CTGTTTCGGA AATATTGCTC 


CAAAAGCAAC 


2340 




AAATATCGTA CATATCACTA AAGATACCCA AAACACTAGA CTTACTGATT 


TATTTTTCAT 


2400 




AAATACAAAC CCTTTCTGTG TAATGGTAAG TTCATACCCA TAACTGCAAC 


ATTTTAATCA 


2460 


20 


TTTGTAATTT TATATAGACA CAATTAATAA TGC CTCATCT TTTAAAAATG 


ATATATAAAA 


2520 




CACACTCAAA TTATTTATCA TTGAGCAACA AAGTATTTTA TTGTATTTAA 


GTAATGCCTT 


2580 




. TCTAGTGCAT TATTGATTTG ATACCTGCAA AGTTGCCATA TTTCCGTTTA 


GAATCAATAG 


2640 


25 


TCGCTAGACA CAAAAAATAA GTCGCCTATA CAGTATTTTC TGCATAAGGC 


GACTTTACTT 


2700 




ACTAATCTAT ATATTAATTA CTAATTTTCC AATCATTGAT TGTTTTTCCA 


ACAATTGATG 


2760 




TGCTTGATAT AAGTTTTCAG GTGATAAACC TTCAAAAACT TGTGTCGTTG 


TTGGTTGGTA 


2820 


30 t 


ATGCCCTGAT TCTATATTTT TCGTAATATC TTCTAAATAC TCATGTTGTT TAATCATATC 


2880 




AGG CGTTCGA TGAATTGGAC GCGCAAACAT AAATTCATGT GTAAATGTTA 


TACTTTTTAA 


2940 


35 


TTTTAATGCA TTTAAATCTT GATCTTCATT AAAAGCTACG- ATAGTCGTAA 


TATGCCCTAA 


3000 


TGGTTTTATC AGTTCAATCA TAGTATTGTA ATACAAGTCT GTATTATAGG 


TGCAAAATAT 


,3060 




ATAATCTACT AATGGAATTT CTTTAAATTG ACGCACTAAA TCCTCTTTAT 


GATTCAATAC 


3120 


40 


GATATCTGCG CCCATCTTTT CACACCACTC TGTTGTTTCT TGTCGTGATG 


CTGTTGTAAT 


3180, 




GACAGTTAAA CCATACCGTT TAG CAATTTG AGTGGCTATA CTGCCTACAC 


CACCGGCACC 


3240 




ATTAATGATT AAGACAGACT TCCCTTCGTT TTCAGCAGGA TTCGTAGAAA 


TTTTAAATGT - 


3300 


45 


ATCAAAAAAC GTTTCATATG CCGTAATACC AGTTAGCGGT AGACTAACCG 


CTTCATTAGC 


3360 




ACTTATGTTG TGTGGTGCTT TTGCAACTAT AGCTTCTGAC ACCAATTGAT 


ATGTCGCATT 


3420 




TGATCCTTGT CTATTTGGCG ATCCAGCATA AAATACAACG TCACCCGGAC 


TAAATAATGT 


3480 


SO 


AACGTCTGGT CCGATAGCTT CAACAGTACC AATAGCATCA AACCCAAGTA 


CACGAGGTGC 


3540 




TTGAGTGACT TCCATTTGTC GTTGCTTTGT ATCTACAGGA TTTACACTAA 


TGCTATTTAC 


3600 
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ATTTCCTTCT TCCAATTTAA AGGGCTTCTC AAATCCTATC ATTTTCATAT CGTTTCACCT 372 0 

CATTTATGAA CTTATTTCTT ATTATACAAA ATAGAAGCCA TGTGTGCTTA TATCGCAGCA 3780 

5 TCATGACTCC TTTTTCATTT GAATATATAA ATAATTACAG ACGACTTTCG TATTAAATTT 3840 

TAGACTTATT TCTACCATGT TGCTGAACAA ATTTACTTTA GATAAAAAAT TATTAAATTT 3900 

TGGTCAATTA ACAAAGTTAG TTTGTTAAAA CGTgATACTT TATTATTCCG TTACTTTAAT 3960 

10 

AACTTGTTTA CCAAAGTTAT CGCCAGTaAA TAAATTTTTA AATGCATGTG GCGCATTTTC 4020 

AAAACCATCT TCAATGGTTA CTTGTGACTG AATTTTACCT TCTTGAACCC ATGTTGCAAG 4080 

CTGTTCACTA GCTTCTTTAA AAGCATTAGC GAATTCACTT ACCAAGAAGC CTCTCATCAT 414 0 

15 

TACTTGCTTC TTAATAAGCG TACCTTGAAT ACGTGGTCCG ATATCGGCTT CAGGATGATT 4200 

ATATGACGAA ATTGCGCCAC ATACTGGTAC ACGTGCAAAA CGATTTAAAT GCTTAAATAC 4260 

20 TTCATCGCCA ACTGTTCCAC CAACATTTTC AAAATAAACA TCAATACCAT CTGGTACTGC 4320 

TTGTGCTAAC GCTTCTGCAA AATCCTCTTT CTTATAATCA ATACCAGCGT CAAAGCCCAG 43 80 

TGTCTCTGTT AAATAATTTA CTTTTTTGTC GCCACCCGCA ATACCTACTA CACGGCAACC 4440 

25 TTTAATCTTA GCAATTTGAC CTACAACTGA ACCTACAGCA CCAGATGCAG CTGAAACCAC 4500 

AACAGTATCA CCGGCTTTAG GTTGTCCAAT ATCAAGCAGA CCATGATATG CTGTTTGTCC 4560 

TGGCATTCCT AAAACACTTA AATATAAATC AAGTGGTACA TCTGTCGTTG GAACTTTAGT 4620 

30 AATTTGATCC GCTTGGACAT GATTAATGAT TCGCCAAGGC AACATACCTA CAACGACATC 4680 

TCCTTTTTTA TAATCTGCGA GTGTCGAATC AATTACTTTT GCAACGACAT GGCTAACAAT 4 74 0 

CGGTTTACCA ATTTCAAAAG GCTGTACATA CGAATCTGCC TTAGTCATAC GTCCTCTCAT 4 800 

35 

ATATGGATCC ACTGAAATAT ACAGCGTTTG TACAAGTACA CCATCGCTCT CAAGTTTaGG 4 860 

j 

CGTGTCAATC TCTTCaATTT TGAATGTATC CTCTTGAGGC ATGCCkTCTG GTATTTTGTT 492 0 

AAAAAGAATT TGTTTATTTT GCATCATTAA TCACCTTTCT TTATTTGAAA CTTTTACTTA 49 80 
40 • 

TTTGTTACTT AAGCGTTAAG TTTGAATTGT GTCtTCGTGA TGTCTGTATG CAAATACATT 504 0 

CTTAGTTGTT ATATTTTGAC TTAAGCACTG ATTCATTCAT GTAACTTCAA CCACATTATA 5100 

45 TTTGCTATAA TCATAAATTT AAAATGTTAC GACTTAGACA TTTTATGGAA ACTCTCAAAC 5160 

AATAGATAAT TTTTGAAAAG CTCTAATATT ACAAGCTTTT TTGCCCCAGA AAAACTAGCA 5220 

GTTG CTTTAT TTTTTCCATA AGAAGTCGAT TAACTCATTA GCAACATTTT CATTCTCATG 52 80 

50 AAGCTGACTA TGTTGTGCAG GCTCACCTTC ATATTTAGAT TCTCGATAAC TTTTCGGACT 5340 

ATTTCCCAGT AAATATTTTA ATGATTTCGA AGAACTATTA GACACTCTGC CGTCTGAATG 54 00 
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ATCTTTTAGC 


ACGCGTAATT 


GCTGATAAGG 


TTGATTCATT 


CGACTTGGTT. TACCATCTTT 


5520 




ATCAACTGTA 


ATTTCATTGA 


CATCTTCATT 


CATATTTAAA 


ACACCATTAA 


ATGTCCCTGC . 


5580 


5 


AATATTCACT 


TGTTTGTTTA ACTGTGGCAG 


TGACTTGTCG 


TTACCATATG 


TCATCATATA 


5640 




TTGTGCAAAT 


GTTAAGTTCC 


CCATTGAGTG 


ACCGACAAAG 


TTGAATTTAT 


CGAAATTGTA 


5700 




TTCAGATTGT 


AACTTAGTCA 


GTACATTTTT 


AAACCACGCA 


GCATTCTTAT 


CCAAATAGCC 


5760 


10 


TTGTCTGTTA 


TTTTCAAGTT 


CAATTTTCAC 


AATAGGATTC 


ACTGCATCTT 


TTCTTAGTTT 


5620 




CCCTTTAAAT GTCACTGCAC 


CATCCTTTGA 


AACGTAAGCA 


GTGATGATAT 


CTTTAGTTAC 


5880 


15 


CCCTCTTTTT 


TCTGCTTGCT 


TCACCATAAA 


CTTTTCAGAA 


TTGGCACTAC 


CACCAAATCC 


5940 


ATGTAAGAAC AATGTTGGAA 


TTGGCTTTTT 


AACAAATTGC 


TGTTGTTGTA TTTTAAATGT 


6000 




TTGTGCCTGT 


CGTTGACTAA 


ACACCACCAT 


AATAATAGAG 


CCTATAATAA 


TAGCGACCGC 


6060 


20 


TAACAATGTC GTAATAATTA 


CAAAAATTTT 


CTTCACACTT 


TTAACTCCCA 


TTCATGTCTT 


6120 




TTATATAAGT 


ATAAAGGATG 


TGATTAAAAA 


TGTCCTTTAG 


TTGATTTTGA 


ATACATCATT - 


6180 




AACTTTTAAG 


ATGACTTTGG 


AAAGTTGTCC 


GTTAACGTTT 


GTTAATTGAT 


TGCTTCTTTA 


6240 


25 


GCTTTCAATG 


GTGTGTCACC 


CATTGATTAA 


TATATAAATA 


TGTATATGCA 


TGTTTAATTT , 


6300 




ATCTCTTTCT 


ATAAATAAAG ACCTACCAGC 


ACTCGACTGA 


TAGGCCTTTT 


AATATCTATA 


6360 




ATTATTTAAT TTCTTTTGTT 


TCGGCTAACT 


CTTTGTACCA 


ATAAGCACTT • 


TTCTTAGGAT 


6420 


30 


AACGTTCTTG 


AGTCTCAAAA 


TCGACATAGA 


ATAAACCATA , 


TCGTTTTTCA 


TAACCATTTG 


6480 




ACCAAGAGAA 


CACATCCATT 


AATGACCAAA 


TAAAGTAACC 


TTTAACATTT 


GCACCATCTA 


6540 




, TAATAGCATC 


TGCAATAACG 


TTCAAATGTT 


GTCTTACATA. ATCAATACGT 


GCATCATCAT 


6600 


35 


GAACTGTTTT 


TTCAGATTCA 


ATAAATTCAT 


CTTTATATCC .TAAACCATTT 


TCAGTGATAT 


, 6660 




AAAXCTTATG 


aTAGTTAGGA 


TAATCTTTAA 


CAACACG CAT 


GaTTTGATCA 


TATAAACCTT 


6720 


40 


GAGGATAGAT 


CATCCAGTCC 


CAGTCTGTGC 


GAGGTACGTC 


GACATCAAAT 


TCACGTTGTC. 


6780 


CGACACCTTT 


AAGTTGGTAT 


TTAGAACCGC 


CTTTATCACC 


TGTCGCATTA 


TGCGTGATTT 


6840 




CAGATTCTCC 


ATCGTAACCT 


CTCATCCAAT 


CACTCATGTA 


GTAATTGATA 


CCTAAGAAGT 


6900 


45 


CGTTTAAATC 


TTTGGCTGCA 


TCTAAAATGG 


CATAATCTTC 


ATCTGTAATG 


TTTAATTTAC 


6960 




CGCCATTAAC 


AGATAAGATA 


TGTTGCACAC 


CTTCCATCGT 


TTCACGAGAA 


TACTTACCTA 


7020 




AATATGTTGC 


ATCTAAGATG 


AATTTATTAT 


GGATGATATC 


TTCTAATTCT 


GCTGCACGAA 


7080 


SO 


CATCTTCAGG 


ATTTGATGGA 


TCGAACGGAT 


ATTTTGTTGG 


CAATGCGTGT 


ACAACACCAA 


7140 




TTTCTCCTTT 


GTATCCGCCA 


TCTTTAAATA ATTTTACTGC 


TCTAGCATGA 


GCCACCATCA 


7200 
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CTACTAAATA TTG AC CATCA CCAATAGGTC CAATTTCATT GAATGTAGTC CAATATTTTA 7320 

CTTCTGGGAA TTCTTTAAAA CAATATTCAG CATAATCTAC AAAGTAGTCA ATCGTTTTAC 7380 

GATTTAGAAA ATCGCCATCT TTGTGTAaCA CTTCTGGTGT ATCAAAATGA TGCAATGTTA 7440 

CAAATGGTTC AACATGACGT TTATGACACT CTGCAAATAA CTTATGGTAA TACTCAACAC 7500 

CTTTAGGGTT AACTTCGCCA TATCCATTTG GGAAGATACG AGACCATGCA ATTGAAATTC 7560 

GGATACCATT AACACCGAAT TTTTCACTTA ATTCTAAATC CACTGGATAT CTGTTATAAA 7620 

AATCACTCGC TGGTTCTGCA GTGTACCAAT AGTTTTCTTC TAAATACGTA TCCCATGCTA 7680 

CGCGACCTTT ACCATCCGTA TTTGTCGCAC CTTCTGCTTG ATATGCTGCT GTTGCTCCAC 7740 

CAAAAATAAA ATCTT CAGGT AATGTTTTAG TCATATGAAA AACTCCTATT CTTAATTTTC 7800 

AAATTGTTGT TGAACGAAAT CAAGGGCTGC TTGGCCATCT CGTGTCAATT TGATATATTC 7860 

AGCACCTTGA GTCTTCGCTA ATTTAATACC TAATCTATCT GTATCTTGCT TAATATCTTC 7920 

ATAGTTAGAC GCAACTTGTG G CG CTAAAAT GATTAATTGG TACTCTTTCA TAATGTCCAT 7980 

ATGTGCGCCA TATCCGCCAG CTGCCGCTTT CACTGGCACA TGATATTCTT CAGCTGCTTT 8040 

ATTAAGTGCA TTGGCTAATA ATCCACTTGT ACCACCACCG GCACAAAGTA CTAAGACATT 8100 

TGTTTGTTCT GTGATATTTG AAGCTTTAGC TGCATCGTCT GATACACCAC TTGCCGCTAA 8X60 

AATTGAATCA GCTTTTTTCG TATCAAAGTT TGCTGCAACT TTTTCTTTTA AATCTGAATT 8220 

ACTTTCTTTA CGTCCTTCTT CTTCATCAAG AATTTCACTA TCATAAACTT TTAGGAATGG 8280 

GTAGTAAATA ATAATATCTA CAACAATCAA AGTAATAGCT AGTACGAATG ACCATAAACC 8340 

AAAACCTGTA CCCATGATAA TGCCCAATGG ACCTGGTGTT GTCCAAGGTA AATTCACACT 8400 

AAAACTATTC ATTCCTAACA CTTCAACGAA AAGTTTGAAA ATCCATACGT TAACAATTGG 8460 

TGCTAATACA AATGGAATAA AGAACACAGG ATTCAATACT AGTGGTGCAC CAAATAAAAT 8520 

TGGTTCGTTT ACACCAAAGA ATGTTGGTAC AACTGATGCA CGTCCAATCG CTTTGTTTCG 8580 

TTTAGATTTC GTCATCCACA TAAACATGAA CGGGACGACC AATGTTGCAC CCGTACCTCC 864 0 

AAATGTAACG ATAAACATTT GTGTACCTGA TGTAATAATT TTATCTGCGT GTTCTCCAGC 8700 

TTGAAGCAAC TTGAAGTTCG CTTCGATATT CGCATATGTA ATGGCTGCAA TTGCTGGCTC 8760 

TACAATTGAC GGACCATGAA TACCTACAAA CCAGAATAAT GCAAAGGCAC CAAAGATAAT 8820 

TGTGACACCA ATCCATCCAT CTGCTGCTGT AAATAATGGT TCGAATAATT TTAAAATACC 8880 

TTCCGCTACA TTTGATTTAA AGCTGTTGCG AATGACTAAA TCTAATGCAT AAAGAATGAT 8940 

GATTACCGCT GAAAATGGAA TTAAGTCCTT AAATACTTGT G AAAT ATT CG GCGGTACTTC 9000 
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AAATGCTGAT 
ACCATCTTTG 
AGAAATAAAG 
TTTCGCTGTC 
CATTAAAATG 
AATTAATAGA 
GATGGCTCTT 
TTGTGCGATC 
TTCATTAAAT 
ACACTGTATG 
TGCGCTTCCG 
CCAGCTTGAG 
ACAATTTCAA 
ACTTATTTTC 
ATATTTTTGA 
TATACTTGAA 
CCAGCTTCGT 
AAGTAAATGT 
TCTTTTGTAT 
ACTTCAACTT 
TTAACCTTTC 
TCGfATGTTA 
CTTTCAATGT 
AGTAAGAATT 
AAACAGTCAG 
AATAATCCAC 
AAAATTGAAG 
TGAGCTACAG 
TGGTCAAATG 



AAGAATGCTG 
GCTGGATCAG 
TTAATTTGAT 
GTTCCTGCTA 
GCTTCCATGC 
AAGATACTTG 
AAATATATGT 
AATTTTTGCA 
CTTTCAGTAA 
CAATATCATC 
CAATGCAATT 
CTGCTGTTAA 
AACCTAATAA 
TTTGTTTCCA 
AACCAGTTGT 
CAGCAC CAG A 
GAGCAAATTT 
ATGGTAAATG 
AAACCACTTC 
TCAATACATC 
TAGGCTTAAC 
ATACTTCTAA 
ATGCTTTCTT 
TAACAGCATT 
GTAAACGACC 
AATCTTTGTT 
ATGCATATTG 
TTGGTT CTTC 
CTAATGCAGA 



TTAATAAACC 
AAGCTAAGAA 
TTGTACTTTC 
CTAAAAATGC 
CTTTATCCCA 
AGAATAAGAT 
TACGTGATAA 
TCATTGTCAT 
AATTGTTGTC 
ACCTTGCGCT 
GTTTCCTTCT 
TGCTTCTAAA 
TTGGACTTCT 
AGATGTCGCA 
ACGTAACCAT 
CCATGTAGCA 
TAAAGTTTCT 
AGTTGCTGCA 
ACCTTCAGCA 
AACGTTAAAG 
TTTTGCGAAT 
AAAGAATGGA 
TTGAATGTTA 
TGCGCCTTGT 
TTTAGCGTTT 
ACGTGCATCT 
TGTTAATTCT 
AGTTTGATGT 
AATGATACCT 



TTTAGTTCCC 
CAAGAATCCA 
TAGCTTACGG 
TACAAGCCCC 
TTTAAAACCA 
GACAGGCATT 
TTTCTCGAAA 
CACCCTCTTT 
ATTAAATGAT 
TCTTTAGCCA 
TCAATCAGTG 
AACTTAGAAC 
TCTCTATTCA 
GTATCTTTTA 
TCACGAGCAG 
CGGCCACAAA 
TGGAATAATT 
TCTTGATCTT 
AAGCCTTCTA 
CGTGGTTCTG 
TcAACAcTAC 
ATATCTTCTG 
ATTTCTTCAG 
TCTTTTAAAC 
ACGTCATATC 
GAAGCTGGTA 
TCCGCAACTA 
TTTGCCATCA 
TCGTTGTTAC 



-ATAAATGCAC 
CACATCGCTG 
TTAAATGAAT 
ATCGTATAGT 
AATATATTTG 
GCAGAAATAA 
AATGGCTTCC 
TATAAAATTC 
CTTGACCATG 
ACAGGCTTGT 
CATCTGCTTT 
GTGCATCCCC 
TAGCATTAAT 
ATACTTTATT 
CATCTTCACC 
GTACCCCGTT 
CCGCAGAAAC 
TAAAGTGTTG 
CATATTTCAT 
AGAATAATTT 
CGTTATcAGG 
CAACACATTC 
CATCATCAAC 
GTTTTGrCAGA 
CAGTTTTTTC 
AACCATATTC 
ATACTTTTAA 
TGCGTTTTAA 
TTAATTGTTC 



TTAAGAATCC 
CTAGCATTGT 
CTGTTAAAGA 
TATATGGTTT 
GCACATATGC 
ATCCATCACG 
CTTTTTCAAT 
TAATAAATGC 
CATCATCGTT 
TTGTGCTCTA 
TGCAAAATCT 
TGCAAATGCA 
CCCCTTTTAA 
TAAGTCATCA 
TTGTTCAATG 
GAATTTAGCA 
ACCAGCACTT 
TGCCGCTTCC 
GTTTACTGGT 
CATTGCTTCG 
AATGTTGTCA 
TGAACCGATT 
ATCATAGTAA 
CCACTCTACT 
ATAAGCAAGT 
AGGATCTAAT 
TTGTTCAATT 
AGCACGACGT 
AATTGATGCG 



9120 
9180 
9240 
9300 
9360 
9420 
9480 
9540 
9600 
9660 
9720 
9780, 
9840 
9900 
9960 
10020 
10080 
1014 0 
10200 
10260 
10320 
10380 
10440 
10500 
10560 
10620 . 
10,680 
10740 
10800 
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TCATCATAAT TATTTAAATT GACATAACCT 


GTTTGTGCTT 


CTTGTGCATT 


CAGCATGCCT 


10920 




AAAGTATTGG CTlTrm'AG TAAATCGTGG 


TCGTTTTCAT 


GATTAAGAAT 


TGCTGAAGTA 


10980 


5 


ATTCCAGCAA CTGTAGAATC ACCTGAACCA 


. ACCGGATTTA ATACACTTAT 


TGTCGGAATA 


11040 




TTCACTCTAT AGAATGTATG ATTGTGCTTA 


GCGAATGCAC 


CtTGTGCACC 


TAAAGACACA 


11100 


10 


ATAATCCACT CAATCCCTTC GAATAAGGGT 


TGTGAGACTG 


CCTGTTTCAA 


ACTTTCTAAA 


11160 


CTTTCATCAA GTGGCTGGTT AAGCAATTGA 


TATAGTTGAG 


AAATGTTTGG 


TTTAATGACT 


11220 




GTAGGTTTGT ATGGATTTTC CAAAACTGTT 


TGCAAAGTtG 


CACCCGAGCA ATCTAATATC 


11280 


15 


ACAGGCACAC CTTTGTTTTG GCATCGTTCA 


ATGATTTGTG 


CATAATAATC 


TTGATTTAAT 


11340 


CCTTTAGGTA AGCTACCTGA AATAGCAACT GCTTCAACTT 


TTTCTAATAA 


TTGTTCAAAA 


11400 




TGTTTAATAA ATCCTGCAGC CTCTTGATTA 


TCAATCTCCG 


GTCCCTGCTC 


TAAAATTTCT 


11460 


20 


GTTTGTTGCC CTTCATGTAA AATTGCAATG 


CAGTTTCGTG 


TTTCACCCTT 


AATGTTATAA 


11520 




AATGCATGCT TGATGTCGGC ATGATCTAAT 


TTTTTAGGAA 


TAAATTGACC 


TAATTCACCG 


11580 




CCAATAAAAC CACTGGCAAG GACTGGGTGA 


CCTACTTGCG 


CAAGTACTGT 


TGTTACATTT 


11640 


25 


AAACCTTTAC CACCAGCTGT TTTACTTACT 


TCTTGAACAC 


GATTAAGATC 


ATCTAATTTC 


11700 




AATGCTGTTA ATGGGTATGA AATATCAACG 


GATGGATTTA ATGTTAAAGT TAAAATCATA 


11760 




TGTGTCGTCC CTTAATCGTG GTATTCGCCT 


CTGTCCCATT 


TTTCTAAGAA 


TTCATCAAAG 


11820 


30 


AAATGTGGAT CAGCTTGATC TGCATTGCTT 


GTTTCTAAAT 


GTTTAATTTT 


AGCGATTAAT 


11880 




TTTTTGTTCT CTTCAGTTGG TTTATATTCA 


GGATTAATAA- 


ATGCATCGAT 


AATATCGCAC 


11940 


35 


ATTAATAACT CACCTATAAT ACGTCCACCG 


AAGCCAATAA 


CGTTCGCATT 


TAATTCTTCT ' 


120 00 


TTAGCGTATA ACGCTGATGT CATATCACGT 


ACTAGTGCTG 


AACGAACGCC 


AGGTACTTTA 


12060 




TTTXCAGCAT TGTTAATACC AACACCTGTf CCACAAATAC 


AAACACCTAA 


GTCTGGATTA 


12120 


40 


CCGCTAACAA CTTGTTCGCC AACIT7TTTTA 


GCAAAAATTG 


GATAATGTGT 


TCTTGTGAAA 


12180 


TCGTATGTTC CTACGTCAAT GACTTCATGT 


CCTTTTGATT 


TTAAAAATTC 


AGATACACGC 


12240 




ATTTTTGTAT CTGTAACAAT ATGGTGGCAT 


CCTAATGCAA 


TCTTCATAGT 


AATTTTTCCT 


12300 


45 


CCTTAGCACA TTTTATTAAG CATATCTACG 


CGGATTTGGT 


GTCTACCACC ATCGTATTTA 


12360 




CCTTCAACAA AACCTTTAAC GAGATTTTTC 


GGTAATGTGT 


CTCCAAGAAT 


TTCAGATCCC 


12420 




ATAGTGATCA TTCTTGAATT GTTATGGCCT 


CTAGTCATAT 


ATCCAGAGCG 


TTCATCTGAT 


12480 


50 


AGTTCAGCAG CAATCATGCC TTTGATTTTT 


GTAGCAAGCA 


TAAAGCTACC 


TGCAGGAAAT 


12540 




GCATCGATAA CAATACCTAA GTTACCTTCT 


TGACTTTGAA 


CATCTTTTGC 


TACAGCCAAA 


12600 
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TCTAATAAGT ATGATTTGAT GACTTCTTTT AATCGTTTGC CAGCTTCATC TGAACCAATA 12720 

ATAATCGCCA TAATAAGACT CCTTTTTACT TTAATTTTGA AATACCTTTC TTAAAATGTG 12780 

ACATATTTAT TTGTAGGTTA TGAAAATCTT GAGAAAAGGC TTTCAATTTG ATTACGTTTA 12840 

AATTATAAAC ATAAACAAAC AATAAATCAA CATAATATGT TTATAATATG TTTGTTTATG 12900 

ACGTATTTTC AAACAATAAG TGAACATTCA TATTGTGGTG TTGTTTTAAT TAGGTATTCG 12960 

TCTGAAATTG TAGTAAAACT TTGTCGAGGT TCCCGTTGaC ATAAATTTGC ATAAAAAAtA 13020 

GCCCATAAAT GAATGCAAAT TCACATTCAC TTATGAGCAT ATAGATACAT ATTTTAACAA 13080 

TGCAGTTATA CTTTTAATTT AGTCGACTAC TTCAATATAT GTTTTAATCG TTTCTACTTT 13140 

TTCTTCATCT TCATAGTCCA TGACCACTGC AGTCAATTCG TTTAACTGAC AAAATGATGT 13200 

AAAATCTTCT TTGCCAACTT TCGTATGATC GATTAACAAG TATTTTTCAA TTGAATTACT 13260 

20 TAGTGCGAGT TGTTGCGTAT AGGCTTCATC TAATGTAGAT GTCATCACAG CACCTTTATT 13320 

TACTGCGTTA CTACTAAAGA ACATCTTGCT AAATCTTAGT TTTTCCAACA TGGCGTTCGC 133 80 

cATTTCACCT ACAAATGCTT CTGTAATATG GCGCATTTCA CCACCAATTA AATAGACACG 13440 

25 AAAATGTGCT GTTTGTTTTT CTAACAAAAT TTTATACACC GGCAAACAAT TCGTAATAAT 13500 

TGTGAGCGTA TGATGATTGA CTTCTTCTGC TAATAGTTCC ACTGTTGTTC CTGGTCCGAA 13560 

AAACAAAGTA TCCCCATCTT CAATTAATGA TGCAGCTTTT TTAGCTATAA ATCGTTTTTC 13620 

30 

TGCAATTTGA CGGGTATGTT TTTCTTTATG CGATATTTCT TTATACTGAA ATGTTGAATT 13680 

ACTGCGTGCA CCACCATGAA TCTTCGTTAA AATCCCTTTA TTTTCCAATT CAATTAAATC 13740 

TCTTCGAACT GTCATATCAG ACACATTTAA ACCTTCGACG ATTTCATTCG TTCTTATCGT 13 800 

35 

GCCCTTTTTA TTCACTAGTT TAGCAATTTC GTCCAAACGT ' TCATGTTTAT ' TCAATGTAAA 13 86 0 

ATTGC2rrC 13 86 8 
(2) INFORMATION FOR SEQ ID NO: 174: 

40 

(i) SEQUENCE CHARACTERISTICS; 

(A) LENGTH: 454 9 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS; double 
45 (D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 174: 

50 TTAAGTCAAC TTTGTCTATA CGGTTTGGAT CtTCTaCCCA ATGTCTTATA AAAGACAATC 60 

CCGCACCTGA AACATAACTC ATGAAATAAG AAAATGGTAT ACCATTAATT TGATCATTTT 12 0 
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10 



is 



20 



AATCTTTACC CATACGAAAC ATCAATTGAT AAAATGCGAT GTCTTTTTCT ATCATTTCTA 240 

TTAAAACGGT CATAATTTGA TGTATGTTAT CCGTGGATAA CTTAACTGCT CCATTTAACT 300 

TCTCATCATG AATGAAGTCT CTTATTTCCT CCAACTGCTG GTCCTCTAAT TTTTCAAGCA 360 

AATCATACTT ATCATAATAA TGCGTATAAA ATGTACTACG GTTAACATCA GCTAAATCTG 420 

CAATTTGTTG CACAGTAATC TCTTCTAATT GGTGTTGATG TAAAAGTTCA ATAAATGCAT 4 80 

TTCTCATTGC AACTTGTGAT TTTCTAATAC GTCGATCTAT AGTCATTTAT ATCAAGTCCT 540 

CCCCAATGAT TATAAACGTT ATGTTCATTA TCCCACAAAT CTCCAACATT GATGATTGGC 600 

ACACAATGTT TACCTGTTTA ATATAGGTGA TACAAACAAA CAGAAAAAGG TGATAACAAT 660 

GAACCAACAT TTACTAGGAA ATCCAAAATT AACTGTAACT CATGTCAATG AAGTTAAAGC 720 

CGGTATTAAC CACATCGTTG TCGACAGTGT TCAATATGGA AATCAAGAAA TGATTATGGA 780 

AAAAGATGTC ACTGTGGAAA TGCGCGATGG CGAAAAATTA TATATTAATA TtTTCAGACC B40 

AAATAAAGAT GGCAAATTCC CTGTAGTTAT GTCTGCAGAT ACTTACGGTA AAGATAATAA 900 

GCCTAAAATC AGAAATATGG GTGCCCTTTG GCCAACATTA GGTACCATTC CGACATCTAG 960 

25 TTTTACACCT GAAGAATCAC CAGACCCAGG ATTTTGGGTG CCAAATGATT ATGTTGTAGT 1020 

TAAAGTTGCA TTACGCGGTA GTGACAAATC CAAAGGCGTC TT AT CT C CAT GGTCAAAAAG 1080 

AGAAGCGGAA GATTATTACG ArTGATTGAA TGGGCAGCAA ATCAGTCATG GAGTAATGGA 114 0 

AATATCGGGA CAAATGGTGT TTCTTATCTT GCGGTGACTC AATGGTGGGT CGCATCATTA 1200 

AATCCACCAC ATTTAAAAgC AAtGATTCCT TGGGAAGGGT TAAATGATAT GTATAgAGAA 1260 

GTAGCCTTTC ACGGAGGTAT mCCAGATACT GGCTTTTATC GTTTCTGGAC TCAAGGTATT 1320 

TTTGCGAGAT GGACAGATAA TCCAAATATC GAAGATTTGA TTCAAGCACA ACAAGAACAT 1380 

CCTCTGTTCG ATGATTTTTG GAAACAGCGT CAAGTGCCAT TATCACAAAT TAAAACACCT 144 0 

CTACTAACAT GTGCTAGTTG GTCTACACAA GGTTTGCACA ACCGTGGCTC TTTTGAAGGA 1500 

40 - 

TTTAAACAAG CTGCATCTGA AGAAAAATGG CTATATGTGC ATGGACGTAA AGAGTGGGAA 1560 

AGTTACTACG CTAGAGAAAA TCTCGAACGC CAAAAATCAT TCTTTGATTT TTACCTTAAA 1620 

45 GAAGAAAATA ACGATTGGAA AGATACGCCT CATGTCATTT ATGAAGTTAG AGATCAATTT 1680 

TATAAAGGCG AATTCAAATC AGCGTCACGT GTCCCTTTAC CTAACGCAGA ATATACACCA 1740 
TTGTATTTGA ATGCTGAAAA TCACACATTG AATCATGCAA AGATTAGTAG CGCGCATGTC ' 1800 

50 GCACAATATG ACTCTGAAGA TAAACAACAA GATGTAAGTT TTAAATATAC GTTTGACAAA I860' 

GATACTGAGT TAGTTGGAAA CATGAACTTA AAACTATGGG TAAGCACTAA AGACTCAGAT 1920 



30 



35 
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CCTGATTTTA ATCATATTGA AAATGGTCAA GTAGCTACTG 


GTTGGTTACG 


CGTATCACAT 


2040 




CGTGAATTAG ATCAAGAAAA ATCCTCAATC GCGCAACCTT 


GGCATAAACA 


TGAAACAGAA . 


2100 




TTAAAGTTGT CACAAGATGA GATTGTACCT GTTGAAATCG 


AATTGTTACC 


TTCAGGCACG 


2160 




; CTATTTAAAC AAGGCGAAAC ATTGGAAGTT GTTGTAAAGG 


. GTAGTGAAAT 


TGTAATTGGT 


2220 




AATAGTACTC CTGGCATGAA AACACGTTAT GAACATGAAG 


AAACCGTAAA 


TAAAGGCATG 


2280 


10 


CACATGATTT ATACTGGTGG TAAATATGAT TCACAATTAA 


TCATTCCTAT 


CGTTAATTGA 


2340 




TATGCAGCAA TTACGGTCGC TTTTGATTAA AAGTGACATA 


GTGATAGGAC 


TGTATAACAA 


2400 


IS 


GAGAAAGCCA CACGCTTGGA ATCTTAAACC AAGGTGTGGC 


CCTTTTTATT 


ATTGATGGCT 


2460 


ATTTAATTTT ATAACACTAT CGTATTTTCT TTTTCATGAA 


TCATTTCAAT 


AATGACATTA 


2520 




TCTTCATTCA TTACTGCTAC TTTAGGTGCA TGGTTTTTAA 


TTTCTTCTTC 


ATTCAACTGT 


2580 


20 


GCATAAGTCA TGATTATGAC TACATCGCCT ACTTCAACAA GTCTTGACGC TGCACCGTTT 


2640 




AAACAAATTT TACCACTACC TCTTTCACCA GCTATTACGT ATGTTTCAAA ACGTGCACCA 


2700 




TTATTATTAT TCACGATGGC TACTTTTTCA TTTGGCAAGA 


TGTCTACCGC 


TTCCAATATA 


2760 


25 


TCTGAATCAA TCGTAATGCT ACCTACATAA TTTAAATTTG 


ACTCAGTCAC 


TCTTGCTCTA 


2820 




TGAATTTTAG CATTC7VTCAT TGTTCTTATC ACTTTATTCA 


GCTCCAATTA 


TTATATTATC 


2880 




TATTAAACGC GCTTTTGAAA ATTTAACAGC TAAcGAGATA 


AATATGCGTC 


CAGTTATTTC 


2940 


30 


GTGTTGTTCT AGTAATTGAG GATAACTATA AACAGCAACT 


TCTTCAATGC 


GTTCACTTAT 


3000 




ATGTGATTCA AGATATTCAG TAACCCTGTC TATAATTACT 


TTACTTTGAC 


GTTCACCGTC 


3060 




TTGATACAAC GCTTGTGCTA ATAGCAAACT TTTACTTAAA 


TGTACCGCTT 


CTTGTCGTTC 


3120 


35 


TTGCTCCGTT AAATAAACAT TTCTTGAACT TTTCGCCAAA 


CCATCTGCTT 


CTCGAACGAT . 


3180 




ATCfi^TACCA ATAATTTCAA CGGCATGATT GAAGTCTTTT 


ACCmTTTGCT 


CGa CAATAGC 


3240 


40 


CAATTGCTGG GCATCTTTTT TACCAAAATA AGCATAATCC 


GGCATAACAA 


TATTAAATAG 


3300 


CTTATTAACT ACTGTTACCA CCCCATCAAA ATGCCCTGGr 


CCGtTCGCTC 


CTTCTAACAC 


3360 




ATGAGCTAAT GGGCCTACTT TGACATCAAT ACCTAATTCA 


CCTGGATACA 


TATCTTCTAC 


3420 


45 


TGCAGGATGA AAAACAATGT CCGCTCCTAC . TTCTGATACT 


AATTCTAAAT 


CTTTATCAAT 


3480 




TTGTCTCGGA TAAGCATCGA AATCTTCGTT TGGACCAAAT 


TGTAATGGAT 


TAACAAATAC 


3540 




ACTCACAATT GTAATATCAT TTGTACTAAC TGATTCGCGT 


AC CATCGTTA 


AATGTCCATC 


3600 


50 


ATGTAAGGCA CCCATTGTTG . GGATAAAACC AATCGTTGTG 


CCTGAGCGTT 


TGGCTGCTTT 


3660 




AACAATGTGT TGCATCTCTT TTACCGTAGT AATCAGCTTA 


GTCATTGTTA 


TTAACCTCAT 


3 72 0 
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GATCGTATTG TTTTAAACCA TCCACACCAA CACTAAAATC AGGAAATTGG TTCACAAATT 3 840 

TCGCTTTATG TTCAACACCA TAATTTAACA TATCGTGATA AACCAATACT TGACCATCTG 3 900 

5 TACCTTTTCC TGCACCAATA CCAATGACTG GAATTGTTAA GTGCTTGCTA ATTTCTTCTG 3960 

CTAAATCATT TGGAATTGCT TCAAGTACTA ACGCAACTGC ACCAGCTTGT TCTACATTTT 4020 

TCGCGTCTAA AATAAGTTGC TCCGCTGCTT CTTTCGTTGC ACCTTGTAAT TTATACCCCA 4080 

10 

TAACGCCAAC ACTTTGAGGT GTTAATCCTA AATGTGCAAC AACAGGAATA CCAATTGCCG 4140 

TTGCTTTTTC AATAAATGGT GTAATATGCG CTCCTTCTGC TTTAATTGCA TTTGCATTCG 4200 

TCTCCTGATA AAGCTTTAGA GCATGATTTA AGTCTTGTGT CATAGAGATG CCTACTGCAC 4260 

15 

CAATCGGCAT ATCAACAACT ACAAATGTAT TTGGTGCGCC TCTTCTTACT GCACGACCGT 4320 

GATGAATCAT ATCTGCTAAC GTCACTTGTA CGGTACTTTC ATAACCTAAT ACAGTCATAC 43 80 

2 0 CAAGTGAATC CCCAACAAGA ATCATATCAA TACCCGCTGC TTCCACTTGT TTAGCACTTG 4440 

GAAAATCATA AGCTGTTACC ATAGAAATTT TAGTTTGCTT TTGTTTCATA TCTATTAATT 4500 

GACTTACTGT TTTCAATGTT ATTCAACCTC TTTTTGCAGT ATnATTAGA 4549 

25 (2) INFORMATION FOR SEQ ID NO: 175: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 8339 base pairs 

(B) TYPE: nucleic acid 
-~ - '- (C) STRANDEDNESS : double 
" ~ (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 175: 
35 - - . 

TTATCTTTTG TTGTTTCCTT AGACAAACGA CTAACCACAT TATAATGGAC TAATTTATTA 60 

ATT-FTATTTA ATTCCATTAA GTTATCCGTA ACACTAAGTG AAGATGCGGA GTTCACTCTC 120 

GTTTGTACTC TTCGTTTTAA TAAAGCACCT CGTAATAATA CAATCATTCT TCTTATTAAT 180 

40 

GATGCTTGTC TATATACCTG TGTTCTTTCA GCATAACGCA TATAGTTTTC AAGTACACTA 240 

TTCGTTATTT GTCCTTCATC TACTAAAGAC TCTAATGTTT .TkGTTTCTAC ATTAAAAGCA 300 

45 ATTTTTTGTA GACGTTCTAA TTCTTTAGAG TTTTCATCAT CTTTCTCTAC AGTTTTTAAA 360 

AATGCTAATT TATCATGATA TTCTTTAATC ACGTTACCAT ATTTAAAACT TGTTTCGAAA 420 

GTAGATTTTT GATTTAGATA ATCAATAACT TGTTCTAATA TATAAATTCT AGCAACTTTA 480 

50 AACGACATAT TGCCAATTAC TGTTTTAGGT GCAGGTTTCG TTAATAATGG CAATAATACT 540 

TGCGCAACTA CCAAACTAAT AATAACCATA CCAGATGCAA TAAATAATAA GTCGTTTCTA 600 
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ATTGTTCCAT GCACACCACA TAACGTCATA ATTAAAGCGT ATAAACTTCG CTTTGGTGGT 720 

TTCTCAGTCG TTGGATTATC ATCATCATTT TTAGTCATCA TTTTTTGGAA TGGACTGATG 78 0 

GCTAAATAAA AAT AAGG AT A TAAGACATAA ACCCAAACAA ATCTAAATAG ATAGACAGCT 840 

AAAGCAACAA CAATAGTGAT GCCTATTAAA AAGATTAAAT TGTGOGGTTC TGTTTTGATA 900 

ATTTTAATAA TAACTTCAGG TACTAAAAAT CCTAATATTG AAAAAACAAA GCCATTTAAA 960 

ACATAACCTA GTATATTCCA TGTATGATTG TAACTCATTT GCAGTTGTGT ACGTACTTGC 1020 

ATAATTCTGT CACGTTCGAA ACCATGTACA. AGTCCTGCAA CTACTGCTGC AATGATTCGT 1080 

GATGCGTGaA ACAATTCAGC AATTAAATAC GTAACAAATG GTGTTAACAA TTGAATAATT li 40 

GTAAACATAT TAATGTTTTC ATATCCTCGA CGCATCAATG TTAATCGGAA CCTTACTAAT 1200 

GCCATACCTA TAAGTAAACC AACCACTGCG CCACCAATTG ATGCAATTAA AAACAACTGA 1260 

20 ACAGCATCAA CAAGTGAAAA AGCACCTGTA ACTAATACTC CAACAGCTAT , TTTAAATGAA 132 0 

ATAATACCAG CAGCATCATT CAATAATGAC TCACCTTCAA GAATTGTCAT TGCTCCTTTT 1380 

GGCAAGACCT TTCCTTTAGT GATTGCTTGC ACTGCTACTG CATCAGTAGG ACAAAGAATG 144 0 
25 GCAGCAATTG CAAATGCTGC TCCAATAGGT AAATCTGGCC AAATCCAATG AATAAATAAA . 1500 

CCTACACCTA TCACAGTAGT AATGACTAAT CCTAATGCCA TCATCATCAC TGGCTTAATA 1560 

TATTTCCTTA AATGGACTCT AGAAACATTA ACACCTTCTA CAAATAACAA AGGCGCAATC 1620 

30 

ATTGTTACCA TAAACAATTC . AGAATCAAAA TTAAATTGAA CAGGGATTGG GGTAATAAAT . 16 80 

AGTAACATGC -CCAAGAAAAT TTGTATAAAT GCTAGGGGTA CTTTAGGTAT GAAAGTATGG . 174 0 

ACAAACGAAC TTAGTATCAC AACAGCTATA AATATAAGAA TTGTTTCAAA TATTTCCAAA 1800 

35 

CTTTCACCTC TCTAAAAAGT ATTGTTTAAT TGAAAATTAA GTATCACATC TCGTTGTAAT . 1860 . 

TATACTTTAG AGGATAAATT GAGTTAGCGA CCACAAAAGC ACTTTAATAT AGATATATGT 1920 

4q CTACGATTGC AGTACTTAAA TTTGCAATTA TTTAATTTTA TTTTATCACT AATTGTTTGT 1980 

ATAAATAAAC AACTTGCTTT CACATAACAA CATTAACTTA TAATACAAAA AATGAGCACC 2 040 

TTAAAATCGA CTAACCAATT TCaAAGTACT CTTTTAATGA TTAATTTTGA AAACAGATTT 2100 

45 TCaAAAGCAT TGTTATGCTT AACAATTTAG CCAACAGTTC AATCGTTTTG ATACCATTTC 2160 

TTACGATGCT CTTCTCGTTT TTCAGCACGT AATTGTAATG CTTCTGTAGA GTTTTGTTCA 2220 

TTTGAACTTA ATAATATTGA TGCATGTGTG TGAGCATCAT TTTTTCGATA CATATAAGCG 2280 

CCGTTGCGAT AAGCAGCGCG AGCGACTAAG TGCATGCCGA CTGGTGAAGT TAAATTAATA 2340 

AAAACAAGTG ACAGTAATAA ACGCACACTG. AAAAATCCTG TATTCACAAT AAAATAAATT 2400 

55 
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CTTAAGAAAA CATCTTGGAA TTTCACGATA CCTATTGCAC TAATAAGAGC AATAAAACTA 2520 

CCTAACAACA ACATCACAGC AGCAATAAGA CTAAAGATTT CTTTTGTTAT TTCCATTAAA 2560 

CACATGCCCC CCACCAATAA AGCGTGATAT TGAAACAGAA CTTACAAAAG ATATAATGGC 2640 

AATGAGCATG ATTGAATCTA AGAAAGAAAC GGTGCCCATA AGTACACTTA ACACACCCAC 2700 

AATTGACATT ACGACAGCAC TTGTTGTATC AAATGTAACG ACACGATCTG CTGTTGTAGG 2760 

TCCCTTGATT AATCTAAATA AACAGATGAT TAATGCAATT CCAAAAATAA TGAGTGAACT 2820 

AATAATCATA ATATGTGTTA TTGTTTGTAT CATCGCGACA CCTCCAATAT TAAGTCTTCA 2880 

TAATGCTTAA TACTTCTTAA CAAACTATCT TTTTCTTTTT CTGACACGTC GATACTATGA 2 94 0 

ATAAAAAACT TTTTAGAGTC TTGAGAAATT CGTATTACTG TAGACCCTGG AGTTATAATA 3000 

ATTAAAATTG TTAAAAATGT TATTGACCAA TCACTTGTTA GTCTTGTTTC ATATGAAAGT 3060 

20 AATCCAGGGT TCATATCTTT TGTTTTAAAA AGAATATAAT TAATCGTGCT AATGCTAGAT 3120 

GTTATTAATT GATATAAATA AACACCTAAA AATTTAATAG CTACCCATAT TTTTCTAACA 3180 

TAAAAATCAT CGCTGAAAAA CCTGTGTAAT ATATAAATGA CAATTAAACC AATTAGATAT 3240 

25 CCAGAAAAGA AAGTCGAGAA TTTAAAATGA TCTTCATCTT GAAATAATAC CCATAAGAAT 3300 

GCAATGATAA TATTTAAAAC TATTTGATTC ATTTAGTCCT CTCCTTTCAA ATGCGGATTT 3360 

ACAAGTTTTT GATATAATTG ATCACTCGTG TTCAACTCAG TTGCATCACT TGTAACATTT 3420 

30 — 

AACACAACAG GTGCAGCAAT TCCGATTGCG ATAACCACAA CTACTAAAAT ACTTAAAATT 3480 

CTT T TT CGAT ATAGCGGGAT TTTCTTAAAA TTAACTTCCT CCCCATCTTT ATCTCCAAAA 354 0 

TACATATAAA AAAGTATCCt AAATAAACTG TACATTGCAA TTAGACTAGT AATAATCATT 3600 

AACGCTAGTC CAATATAATT GCCATTTTGC AATGCACCTT GGAAAATAAG TACTTTCCCC 3660 

GGAAAGCCAC TAAATGGAGG CACGCCGCCA ATAGCAAAAA TCATTATAAT AAACGCAACT 3720 

CCAAATAAAG GTTCTTTTTT AGCTAAGCCA TTCAAATATT GATATTGTCG ATAG CCTGTA 3780 

ATGTAAACTA AACTACCAAT AATAAAAAAT AGCAATGTTT TTACAACAAT GTCATTTACC 3 840 

AAATAAAATA TTGCACCATT AATACCTGCA AACGTGTTTG TTCCTAAACC TAAAATGATA 3 900 

45 AATCCTATTG AGATTATGAC TTGGTAAGCT GCAATCTTTT TAATATCTTT ATAAGCAATG 3960 

ACACCTATAG CGCCGATGAC CATAGTTATA GCAGCCATAG TTGCTAGCAA TGGATGTATG 4 020 

AGATCATTAT GTTGATCAAA TAGTAAAGTG AAGAATCGAA TTAATGCATA GGCCCCTACT 4 080 

50 TTGGTCATTA ACGCTGCAAA TAATGCTGCA AGCT CAGTAT TTAACACAGC GTAGGCTTTG 414 0 

GGTAGCCACA TAAAAAGGAC CAGCGCTGCT TTCGCACTAA ATGCGACTAA GAAGATTAAT 4200 
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AAGTTTAATG TACCTACTGT TTTATAAAGT AAACCTATAC CTAATAAGAA TAGCCATGAA 4320 

CCAATAATAT TCAAGACAAC ATAAATAATT GCAGCACGTA* ATTGTTCTAC AGATTGTCCA 4380 

5 

AGTGTAATGA GTACAAATGA CGCTAGTAAC ATAATTTCAA ACATGAGGTA TAAATTAAAT 444 0 

AAATCTGATG TTAGAAAAGA GCCTATCACG CCAACACTTA AAAATAATAT GAACGATGGC 4500 

AAGTGATAAC GATTTGCTTT ATGTTCGCCA CGCCCAAATC CGTATGCCAT AATTAAAGTA 4560 

10 

ATCACAAACG AAGCGGTTGT AACCATAATT AAACTTAAAG AATCTCCTAA AAACTGTATA . 4620 

CCAAAGGGCG CTGACCATCC TCCAAAGTCT AGCGTAATTG GACGGTGACG CTGAACATAA 4680 

1S ATTAATAGCA TTAATGAAAT AATTGTGGTG ATAGTCATTG TACCTAAGTA TAAATATTTA 4740 

GAAATACGAT CATTATTTTT TAAAAATACA AGGATTAAGG CACAAAGGAA TGGTAATAAC 4800 

ATTGGTAAAA TCAATAAGTT ACTTAGCATC ATCTTCCCCC CTTAGGCCTT CAATTTCATC 4860 

20 TTCTTTTGTT ACTTTATAAG TTCTATAAAC AAGTACAAGT AAAAACGCAG TCATCCCAAA 4920 

CCCTATAACT ATTGCAGTTA GTACAAT AGC TTGTAACAAG GGATCAACAA ACAATTGGTT 4980 

TCCACCAGTT ATTAGTGGTT CTGATCTACT AGAACCATAC GTTCCCATAC TCATAATAAT 5040 

25 GAGATTACCA GCATGAGTAT ATATTGAAAT TCCGATTACA ATACGAATTA AATTGATTGA 5100 

TAAAATCATA TATGTTCCTA TAAACACTAA AAATCCTATA ACTAGTAATA ATATTAAATT 5160 

CATGATCGAC CTCCGCTAAG CGACAACATC ACTGTGACAA TAACACCAAC AACTGAGAAT 5220 

30 

AAAATACCTA ATTCAAAAAG TGTTATTGTA CTTACATGAA TTTGTCCTAA AATTGGAAGT 5280 

ATCCAAGTTG TTTCATATTG AGACAAAAAT GGTTTTCCAA AAAACATAGG TATTATCGCA 5340 

GTAATAGATG ATACCAATGC TCCAATAATC ATTAAAATTC TAAAATCAAT CGGTAAACTT 5400 

35 

TCTAAAACCT CTTCAACATT AAAAGGCAGA AACATTAAAA ^ TAAACGCTGA ACTAAATATT * 5460 

AAACCACCAA TAAACCCACC ACCAGGATTA TTATGACCTG CGAAGAAGAC ATAGAATCCG 5520 

AAAGTCAATA AAATAAATAC AACAAGTTTC GTGACCGTTC TTAACACGAC ATCATTCTCT 5580 

40 

TTCATCTTGT CCCCTCCGAT CTTGATAATT TAATAATGtg TAAATACCTA GCCCAGTAAT 5640 

AATTAACACT AATCCTTCAA ATAATGTATC TAATGCTCTA AAGTCACCAA GTATCG CATT 5700 

45 TACAATATTT TTACCACCTG TTAGTTTGTC AGCTTTTAAA TAAAAGTCTG ATATTGATGA 5760 

TAAACCATCT GTTTGTTGTG TAATAAAAAT TAATGATACA ACAATAAGTG CCATCAAGAG . 5820 

TGATACAGAA ATTTTAATTA TTTCTCTTTT TTTGTTAGCG TTAGATCTTG GCACGTTTGG -5880 

50 TAATCTTGAA AAACTGACAA TAAATAGTAT CGTCGTTATT GTTTCAACTA CTAGCTGAGT 5940 

CAATGCTAGA TCAGGGGCTT TCATTGCTAT AAAGAATAAG GTCACAACAA ATCCGATGAC 6000 
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GACAGTTACG ATTGCTAATA TAATTTCTAA 
TACTTTAGGA AGTCCaATTC GAATATAACC 
5 GGTCATAATA ATGTACTGGT TTAAACGATC 

AAACTTTTCA AAATGTCGAT ATACCATCTC 
TTTACCTGTG AACACTTTTT TCCAATGTAC 

10 

AATGATGATG GTTAAAAGAA GCGGTATGTT 
CAATTGATCA ATTTGATGAT TACCACCTGA 
CTTCCCAAAT ATATnTGGTA CAAAAAAGAT 

15 

TGGTAAACTA aACAACCATG GTTCGTGGAT 
TTTTGtCCAA AATACTTCTT TTACCATGTA 

2Q AATAACACCA ACAAACACGA TAGCTATCAT 

AGTTTGTGTT AATGCATCTA AAAACATTTC 
TCCAGCCATA GATAGAGCCG CTATCGTCAT 

25 CATTCCACTT AAAATTCGTA TATCCCTTGA 

CATGAAAAGC GCACATTTAA AGATGGCATG 
TACmAATACA TAAATaGATG CTATTGCGTC 

30 ACCCAGCATA GCCATAATCA TCCCAAGTTG 

TAAATCCCAT TGTTTTAAAG CTGTAATTGA 

CGTAACGATA TATACGTACA TATTGCTAnG 

35 

AAnGATACCA GCTTTTACCA TCGTGGCTGA 

AGCCATTGCT CTAGGTAGCC AGTATGAAAT 

AATAAAAACA TAAAAATCAT AGGGATAAAC 

40 

CCTAATATCT CTGTGATGTT ATTCGTTCCT 
AATAACGCCA ATCCACCAAA TACTGTAATC 
TCACCATTGT TATACCAATA TGAnATCAAT 

45 

AAaATGTACA TCmATATCGT ATTGTCTGAT 
AACGTTAAAT AAAAATAAAA CCTTGGTAAA 
50 GCATAGAAGA ATACTGCAAT TCCAATAAGT 

CCATCTAAAC GTAAATCTAA ATTAATATCT 

55 



TGCCCCAAAT TCAGAAACAT GTAACTGATG 6120 

AT ATC CAATG ATAAT CAT AA ATATGCCTAA 6180 

TTGCATAACA CGTTTAAATC GCTTCGTAGC 6240 

ATAGCTTTTT GAAACTGAAA TCTGTCTAAT 6300 

TTTGATTGCT AGTACACTAC CCAATAAAAT 6360 

AAATCCATGC CATTGCGAAA CATGTGGTGC 6420 

TACAGCTCTT AATGCnAGAA CGATAATCCC 6480 

TACAGGTACT AGCACCATTA aTATAAGAGA 6540 

ATTTTTTTTA GTAAAAACCT TAGAATCATA 6600 

TAGTGCATAT GTGAATGTAA AAACACTCGC 6660 

TGAAATCAAA CTAAATTGGG ATAATTGTCC 6720 

TTTACTTAAA AATCCATTTA AAAATGGTAC 6780 

GACTAGATTC ATTTTAGGAA ATAGTTGACG 6840 

ACCTGCTTCA TGATCTAAAA TAC CTAGTCC 6900 

ATTCATTAGa TGAAATAGcG CACCArATAA 6960 

TTGTTGGTGT TGAGCATATC CGCCACCTAT 7020 

ACTGATTGTA GAGTACGCTA GGATACCTTT 7080 

ACCAAATAAC ATTGTTATTA AACCAACAAA 714 0 

ACCTAATAAT GGTGTAAATC GAAGTAATAG 7200 

ATGTAAATAA GCACTTACAG GTGTAGGTGC 7260 

GGAraTTGTG CTGATTTTGT AAATG CACCT 7320 

AATCCATGAT TCTTAATATG ATCTG CTTGT 7380 

GTCATGATAT ACAGCATAAT AAAACCAACT 7440 

ATAAATGATT GAATCGCACC AAATTGACTG 7500 

AAAAATGATG ATmCACTCGT TAATTCCCAA 7560 

AATACaaTAC CAAT CAT ACT GAACATAAAT 7620 

TTGT CTTTTC GAGAGGATAA ATATTGAGTT 7680 

GAAATAATAA GAGAAAACAT TAAACTTAAA 774 0 

AATGTCTTAA TCCATGGAAT AGAGGTAGAA 7800 
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GGTGCAACCA ACGCTATGTA CCCGGCATAT TTAGCCAATG CTCTACGTTT AGACATTAGA 
AGTATCATCG CCATAATCAC AAGTATAGCA ATTAATAAAT AAACCAAACT CATT ATT AG C 
CTCCTTTGTT TCTATAATTG TAATGAAATA TAAATAGTAT GTTCACACTC ATTTTCTAAA 
CCGATAAAAT TTAGTGTTTC AATAGCAGAT TGATGCCCTA AATACTTTTG AATGACTGGT 
ATAAGTATAC CTTTTTGATA AGCATGATAT GCAAATGTCT TACGCAATGT CGTTAGTCCT 
ACATTATCTA TACCAGCTTC AATTGATGCT TGGTGAATTA TTCGATATGC TTGCTGTCTA 
GATAATACTT GATTTGTTCG TAGTGATTGA AAAAGAACGT CTTCATTCGA AAGACTCCTG 
TCCTCTATAT ATTGAAGTAG TTCTTTCGAT AATGTTTCTG GTAACCTAAT TTTAATCAA 
(2) INFORMATION FOR SEQ ID NO: 176: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 588 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

• (Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 176: 

CC CGATTTTT TTACGTAATC TAATACATAC GG CAAAATCA ACTTTAATCA AAAAAGACTC 

ATACACAATG CCTTTAAAGC ACATGTATGA GTCCTTTTTA GTAGTTTATA TCAAAAAATA 

GTTTAATGTA TAAATTAGTT TTTGTTTACA GATGCGTCGT AGATTGATTC TACAGCATCA 

CCTAAAGCTT TATCGAATTC TTCTTTAGAT TGATCAGCTC TTAAATCACT AG CTAATGCA 

CGTGAGAAAC TTGCGATAAG TTCAGCGTTA TCTTTAAGTA ATTCATTTGC TTTTTCTCTG 

CTGTAACCAC CTGATAATAC AACGACACGA ACAACATTAG GATGTTCAGC TAACTCTTTG 

TATAAGTTTG GTTCAGTAGG AATTGTTAAT TTCAACATTA CTAATTGATC AGCATTTAAG 

CTATCTAAAC CTTTTTTAAG TTCAGCTTTT AATACTTTTT CAATTTCAGC TTTGTCTTTT 

GCATTAATAT TAACTTCTGG TTCGATAATT GGAACTAAAC CTTTAGCAAT AATTTGTTTA 

GCAACTTCAA ATTGTTGTTC AACAACGTCT TTGATACCTT GCTCATTT 

(2) INFORMATION FOR SEQ ID NO: 177: 

(i) SEQUENCE CHARACTERISTICS : 

<A) LENGTH: 2841 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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ATAGAGTnCT GGnACTTACT ATGACATATG GCGCTAGAAT GGCTGAGCCA GGTGAATTTA 60 

CAAAACGTGC CTTTTTAAAT GGTCGTATTG ATTTATCTCA AG CTGAAGCA GTTATGGACT 120 

5 TTATTCGCTC GAAGACAGAT AGAGCTTCTA AAGTTGCGAT GAATCAAATT GAAGGTCGTC 180 

TAAGTGACTT AATCAAAAAA CAACGTCAAT CTATATTAGA GATACTCGCT CAAGTGGAAG 240 

TGAATATTGA TTATCCTGAA TACGATGATG TTGAAGATGC GACTACTGAA TTTCTTTTAG 300 

10 AGCAGTCTAA AGAAATCAAA CAGGAAATTA ATCGTTTATT AGATACCGGT GCGCAGGGTA 360 

AAATTATGCG TGAAGGTTTA TCTACAGTTA TTGTTGGTAA ACCAAACGTA GGTAAAT CAT 420 

CGATGTTAAA TAATTTAATA CAAGATAATA AAGCGATTGT AACTGAGGTA GCAGGTACTA . 480 

15 

CTAGAGATGT CTTAGAAGAG TACGTCAATG TTCGTGGCGT GCCATTAAGA TTAGTTGATA 540 

CTGCTGGTAT ACGTGAGACA GAAGATATAG TAGAGAAGAT TGGTGTTGAA CGCTCTAGAA 600 

AGGCTCTTAG CCAAGCAGAC TTAATTTTAT TTGTATTAAA CAATAACGAA GCATTGACwC 660 

20 

AAGAAGATTA CACATTATAT GAAGTGGTTA AAAATGAAGA TGTAATCGTA ATTGTTAATA 720 

AAATGGATTT AGAGCAAAAC ATAGATATTA ATGAAGTTAA AGATATGATA GGTGATACGC 780 

CATTAATTCA AACTTCAATG TTAAAACAAG AAGGTATTGA TGaATTAGAA ATACAAATTC 840 

25 

gAGATTTGTT CTTTGGTGGa GAAGTACAAA ATCAAGATAT GACTTATGTT TCTAATTCAA 900 

GACATATTTC ATTATTAAAA CAAGCAAGAC AAACGATACA AGATGCGATT GATGCAGCAG 960 

3Q AATCTGGTGT GCCTATGGaT ATGGTACAAA TTGATTTAAC TAGAACTTGG GAAATATTAG 1020 

GAGAAATTAT TGGTGAGACT GCAAgTGATG AACTCATCGA TCAGTTATTC AGTCAATTCT 1080 

GCTTAGGTAA ATAGTAATTG AAATAGACGG AATACCGTCT TAAGAAGGCT AGTAAGATAT 1140 

35 CAAATAAGGA GGTTTATATT GTGGTTCAAG AATATGATGT AATCGTTATA GGTGCGGGAC 1200 

ATGCAGGTGT AGAAGCAGGT TTAGCATCTG CAAGACGTGG TGCTAAAACA TTAATGCTAA 1260 

CAATAAATTT AGATAATATT GCATTTATGC CATGTAACCC ATCTGTAGGT GGACCAGCTA 1320 

40 AAGGTATCGT TGTTCGTGAA ATTGATGCTT TAGGTGGACA AATGGCAAAA ACAATCGATA 1380 

AAACACACAT TCAAATGAGA ATGTTAAATA CAGGTAAAGG ACCTGCTGTA AGAGCACTAA 144 0 

GAGCGCAAgc AGaTAAAGTA CTTTATCAAC AAGAAATGAA ACGCGTGATT GAAGATGAAG 1500 

45 AAAATTTGCA TATAATGCAA GGTATGGTAG ACGAACTTAT TATAGAAGAT AATGAAGTTA 1560 

AAGGTGTACG TACAAATATT GGTACAGAGT ATTTATCTAA AGCAGTAATT ATTACAACGG 1620 

GAACATTTTT ACGTGGTGAA ATCATTTTAG GTAATATGAA GTATTCAAGT GGAC CAAATC 1680 

50 

AC CAATTAC C ATCAATCACA TT AT CAG ACA ATTTAAGAGA ACTTGGTTTT GATATTGTTC 174 0 

55 



858 



EP0 786 519 A2 



10 



15 



20 



25 



40 



45 



50 



AAATACAACC AGGTGACGAT GTAGGTCGTG CATTCAGCTT TGAAACAACA GAAT AT AT AT 

TAGATCAATT GCCATGTTGG CTAACGTATA CTAATGCTGA AACACACAAA GTTATCGATG 

ATAATTTACA TCTATCTGCA ATGTATTCAG GGATGATTAA AGGAACCGGG CCACGTTATT 

GCCCTTCAAT TGAAGATAAA TTTGTTCGAT TTAATGATAA GCCGCGACAT CAACTTTTCT 

TAGAGCCTGA AGGTCGTAAT ACAAATGAAG TATATGTGCA AGGATTGTCT ACAAGTCTTC 

CTGAACATGT GCAcGTCAAA TGTTAGAGAC GATACCAGGT CTTGAAAAAG CAGATATGAT 

GCGTGCCGGC TACGCAATTG AATATGATGC GATTGTGCCA ACGCAGTTAT GGCCTACACT 

TGAAACGAAA ATGATTAAAA ACTTATATAC TGCAGGTCAA ATTAATGGTA CATCTGGTTA 

TGAAGAAGCA GCAGGACAAG GATTGATGGC AGGTATTAAC GCTGCAGGTA AAGTGTTAAA 

CACAGGCGAA AAGATATTAA GTCGTTCAGA TGCATATATT GGTGTCTTAA TCGATGATCT 

. TGTAACTAAA GGTACTAATG AACCTTATCG TTTACTAACA TCACGTGCAG AATATCGTTT 

GTTAcTACGT CATGATAATG CTGATTTGAG ATTGACGGAT ATGGGATATG AACTTGGTAT 

GATTTCTGAA GAAAGATATG CACGTTTTAA TGAAAAACGT CAGCAAATTG ATGCGGAAAT 

TAAGCGTTTA TCAGATATTC GTATTAAACC AAACGAACAT ACGCAAGCGA TTATTGAACA 

ACATGGTGGT TCTCGCTTAA AAGATGGTAT TTTAGCTATC GATTTATTAC GCAGACCTGA 

AATGACTTAC GATATAATTT TAGAACTTTT AGAAGAAGAA CATCAATTGA ATGCAGATGT 

TGAAGAACAA GTAGAAATAC AAACAAAATA TGAAGGTTAT ATCAATAAAT CACTACAACA 

AGTTGAGAAA GTTAAGCGTA T 

(2) INFORMATION FOR SEQ ID NO: 178: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3025 base pairs 
Z (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 178: 
ATCTAATTTC AAACCCGGTG ATAAATTGCC AAGCGTGACG CAATTAAAAG AACGTTATCA 
AGTAAGTAAG AGTACTATCA TTAAAGCATT AGGCTTATTG GAACAAGATG GTTTGATCTA 
TCAAGCACAA GGCAGTGGTA TTTATGTGAG AAATATTGCT GATGCCAATC GTATCAACGT 
CTTTAAGACT AATGGTTTCT CTAAAAGTTT AGGTGAACAC CGAATGACAA GTAAGGTACT 
TGTTTTTAAG GAGATTGCAA CGCCACCTAA ATCTGTACAA GATGAGCTCC AATTAAATGC 
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CGAATATTCT TATTATCATA AAGAAATCGT GAAATATTTA AATGATGATA TTGCTAAGGG 4 20 

CTCTATCTTC GACTATTTAG AATCAAACAT GAAACTTCGT ATTGGTTTTT CAGATATTTT 480 

5 CTTTAATGTA GATCAACTCA CTTCAAGTGA AGCTTCATTA CTACAATTGT CTACAGGTGA 54 0 

ACCATGTTTA CGTTACCACC AGACTTTTTA TACAATGACT GGCAAACCCT TTGATTCATC 600 

TGACATCGTA TTT CATTATC GTCATGCACA GTTTTATATT CCTAGTAAAA AGTAATAAAT 660 

10 ACATAAAAAC GTCTATATCC CAGTTATAAA CTGGAGTATA GACGTTTTTT TACGATAATA 720 

ACAATGGCTC AAATTGCTAT TATCTTGCTT AGGTTTTTCG TTTTAGAAGA ATATTGCTAC 780 

AAAGACAGGC ACAACTGCTA CAACAACTAC ACCAACTAAC ACTAAAGCTA TACTTGCCAT 840 

15 

TGATTCTTCT ACAGGTCCTA ATTCTTTGGC TGGTGCTACA CCTAATGTGT GACCACTTGT 900 

TCCAAGTGCT AATCCTCGGG CAATAGGGTT AGTAATTCGG AAAAGCTTTA AGAATTTATT 960 

ACCTAGGGCA TAAATAATGA CACCATTTAA AATAACTGGT AATGATGTTA ATTCTTTTAT 1020 

20 

ACCACCGATA CCAGCTGATA CTGGTAACGC AATCGCTGTA GTTGCTGCTT GAGGTAACAT 1080 

TGATAAAATA ACATCATTGG CAAATTGTGC TAACTTCGCA AAAGTTAAAA TAATTAATAA 1140 

2s CGCTACAACT GTACCGATAC CAATACCTCC GATGATACGA TGCCAATGTT TAACAAGCAC 1200 

TTCACGCTTT TTATATAACG GAATCGCAAA ACAGATTGTT GCCGGTTCTA AGAAGAAGTA 1260 

AATAATGTCT CCACCTATTT TGTAAGTCTT ATACGGAATG CCTGTTAAAT AGAGGAAGGC 1320 

30 CACACCAAAT ACCATACTGA CAAATAGCGG TGCGAATAAG AAGAAACGAT TAGTTTTTTC 1380 

AAATAATATG GTCGCTAAGA AAAATGGTAT AACGGATAAC AGTATTCCGA AGTAAGGTGT 1440 

GTTTa GTGCT AAGTGGTTAA TCaTGAGCTT GTGCCTCCTC TATTTTGATC TTTTTTGTGA 1500 

35 CTTTGTCACC TTTAGATCTC GAAGTAACTT TCATAATAAT TTgTGTGACA TAGCCAGTAC 1560 

AAAT&AGTAA TAG TATTGTT GAGACGATTA TTAGTCCAAT GATTAAAAAT GGTGCTTGGC 1620 

TAATGACACC TAAAGAGTTA ACAACTGAGA TACCGGCTGG TACGAAGAGT AAGCCAATGT 16 80 

40 TATTTGTTAG TGTCGTTCCT ACTTTTTGGA CTTCGCCTAA CTTAACAGCA CCAGTACATA 174 0 

ATAATACAAA TAATAATACT AAACCGATTA CTGATGCAGG CATAGGAATT GGCATAAATG 1800 

AtTCAATTAT TTTCGATACA AAGAGTACTA AAGCAATTAC AATGACTTGG TGAAAAAAGT 1860 

45 

GTGCTGGTTT TGATGCGTCT TTTTGTTGTT TCACGACCAT TGCCTCCTAC GTTTGATTTA 1920 

ACTAAAGTAT AGATGGCTCA CTTCGATTTG CGTGATTTTT AGTCCGAAAT ACAAAATATC 1980 

ATAGGTAAAA TGCATAAAAA AAAGGATTAC TGTTAAAGTA ATCCTATCGA CGCTTTAAAA 2 040 

SO 

TCTTTCATAA ATGAACGTCC AACTTG CAT C TTGACACCAT TTGTCAATAT TACCATATAA 2100 
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TGAATACGTA TAAAATAAGT GGGATTCAAT CGTTTTTCAT AACGATTCAA TGGCTCTGTT 2220 

GTTTCGTATT TATGATTCGT TGTATGTATG GTTGTAATAC CATTATGTGT GCCAATCCCA 2280 

ATAATATTTT GTTGCTTTAA CATGTGAATT TTATCGTCAA TTTCAACAGG TAAGCTTTGA 234 0 

TCAAAATTCG CCGACATATC ATTCGCAATT GCACTTGCGT TATTATCATC TTTGGCTTTA 2400 

GTCGCACGCA CTTTATTGAC TGCTTGTTCA ATACGTTTTT GACCAAACGG TTTCAAAATA 2460 

TAGTCTGTCG CATTTAATTC AAATGCCTGT ACTGCGTATT GGTCATGTGC AGTTGCAAAA 2520 

ATAATCGCAG GTGGCTCTTT CATCTTTTGA ATCTTAGCTC CTAATTCGAT CCCATTTTCA 2580 

TCCATTAAAT TGACATCTAA AAATATAATG TCATATTGAT TGATCAGTAG TGCTTCCAAT 2640 

GTTTCTTTTA CATTTTCTGC CTCATTAATT TCTTCAAAAC CACCAATTTC ATTTAATAAA 2700 

TATGTTAATT CATTACGTGC TAATGGCTCA TCATCTATGA TTAATGCTTT CATATTTATT 2760 

CCTCCTCTTG TCTTTCATAA GGAAGTACAC ACCAAAAAGT GGTACCGCTC GATGTCGATT 2820 

CAAATTGTAA TGCTGCGGAT TTTCCAAATA ATCCTTTTAG GCGTAAGTTT. AAATTTTCTA 2880 

AAGCACTACC AGTTCCAGAC TCTGATTCTA CAGATGTllTC TCCCaACAAA TGCATTTTAT 2940 

25 CTTTAGAAAT ACCCTGACCA TTATCTTGTA CAATAATACG TACATGTGTT GCAGTTTCTT 3000 

TAATCACTGA CACGTCAATA TCGTT 3025 
(2) INFORMATION FOR SEQ ID NO: 179; 

30 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1689 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 
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"(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 179; 

ACAGAATTTC ACAGCATTTT TAGATGAAAA AATAAGCCAG TCATAGCGTT GATTTAACAA 60 

ATGAATATCA AAATTTAGTG GCTTTATATC AATAAAGGGT TTGTGAATAA TTGATACTAA 120 

ATCACTTTGC ATGTCATTTG TTTGTGTCAT AACTACAACT GGCTTCATAT TTAAACGTCA .180 

CTCCATTATT TAATGTTGTT CATTTAAGCG TTTTATAATT TCATAAGCAC CTTGCTCTTT 240 

TAATTTGTTA CTCACTGTTT TGCCTAACTC AACCGGATCT GTTCCGTTCA TTGTATATTC 300 

AAATCGTTCT TTACCATCTG GGGTCATAAT TAAACCTGTA AATTCGATTT CGTTTTGATC 360 

TGAGATTGTA GCATATCCTG CAATTGGCAC CTGACAACTA CCATCCATTT CTGCTAAAAA 420 

CGTTCGTTCA GCAGTCACAC ATTTTGCAAC CTCATCATTA TGTACTTTGC TTAATAATGT 480. 
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TAACAATGTA 


TCTCTATCAA 


GATAAGATGT 


TnCAATATCA 


TCTGACCAGC 


CCATTCTTCT 


600 




TAAACCAGCT 


GCAGCTAAAA 


TAATCGCATC 


ATAATCTTCA 


GTTTGTAACT 


TTTCTAATCG 


660 


5 


TGTATCTATA 


TTACCTCTAA 


TCCATTTAAT 


CTCTAAATTA 


GGATACTTAG 


ATAATATTTG 


720 




TGCACCACGA 


CGTAATGAAG 


TAGTACCAAT 


AATACTGCCT 


TCTGGCAATT 


GGGATAGTGG 


780 


10 


TGTATGTGTT 


TTAGAAATAT 


ACGCATCAAA 


AGGTAATTCT 


CTATCAGGGA 


TACAACCTAA 


840 


TGTTAAACCT 


TCCGGAATTA 


CACTTGGTAC 


GTCTTTAAGC 


GAGTGTATTG 


CCATATCGAT 


900 




ATrrrrrrcA 


AAAAGTTCAT 


GTTGTATTTC 


TTTAACAAAT 


AAGCCTTTGC 


CTCCGACTTT 


960 


15 


AGACAATTGT 


TTATCTACTA 


TACGATCGCC 


TTTCGTGaCA 


ATITCTTTAA 


TTTCAATTTC 


1020 




TAGATTTGGC 


TCGACAGCTT 


TTAATTTATC 


AATAAATTGC 


TGGCTTTGTG 


TTAAAGCTAA 


1080 




TTTACyTGTT 


CTGGAGCCAA 


CGACTrATTT 


ACGCATGTTC 


AATTCCTCCT 


AGGAACGGAT 


1140 


20 


TGCTCTAGAT 


TATTTTCTCA 


ATTCACAAAA 


TGTGTTGCAA 


AAAATAAATT 


AATCATATTT 


1200 




AAGCAAAATA 


AAATAATGTT 


ATAGTATATT 


AAATATCTTG 


AATTCAACCA 


TTTGTTGATT 


1260 




CTAAGTAAAA 


TATAACTTCC 


ATATAATACT 


GTAATAATTG 


AAGAGAGTAT 


TACCTTCGGG 


1320 


25 


TCAATGAATA 


TACGTTCACC 


AACTGAAATT 


ACACCCCACT 


GTGTACCTAA 


AATAATACTA 


1380 




AATATGAGAA 


TTATCCACCC 


ACTTAACGTT 


GAGTAAAACA 


CAATTGATTC 


AAGTGTAGCA 


1440 




ACGCTACCAA 


TTCTAAAGTA 


TTTTTGATCA 


AAACGTTTTT 


CCTTCAAATT 


ACGGTATTGC 


1500 


30 / 


ATGATATACA 


GTAATGCATT 


GACAAAAGCT 


AAGGCAAAGA 


AGACATAACT 


TAACACAGCT 


1560 




AGACCGATAT 


GGACTAACAG 


TAACTCGTCT 


ACAACAGCAA 


TTTTCTGAAC 


CTTATTAGTA 


1620 




TAATGTGTCG 


GTTGAAATGT 


ATTCATCCCT 


AAnAGTGTTA ACCCTATTAA ATTCCAAGGA 


1680 


3S 


AAAACACAG 












1689 



(2) Information for seq id no: 180: 

(i) sequence characteristics: 
40 (A) LENGTH: 1209 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 180: 
nTGGnTGGCT TTTC CTATTG GACCAAATGG ACCnTTTACC TGGCCnTTCC CAGGACACCC 60 
so CGCTTGTGCC CACATTCCAA TCGGAAAAGG TGTATGTGGT ACAGCCGTTT CAGAACGTCG 120 

TACACAAATT GTAGCTGATG TTCATCAATT CGAAGGACAT AT CGCTTGTG ATGCTAATAG 180 
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CGATGCCCCT ATAACGGATC GATTTQATGA CAATGACAAa GAaCATCTTG AaGCAATTGT 
TAAAATTATT GAAAaGCAAC TCGCATAAAA GGACATCAGC ATTTTCAATA AAGTGTTGAC 
AGTTAGCAGG AAAATGTTAC AATAATCTTT GTGTGAATTA ACGAAAGTAG CAGTTGTATA 
TTATTGAGCG CTATGTTGTT.: CCCAATGCGG ACGTGTCACG TAACTGTCGC TATAAGGTGA 
^ AGACACATAA AACAATATAT CTTAGTAAGC ATGCAACACT CTTTTTTGTT TATTCATAAC 

AACAAAAAAG AATTAAAGGA GGAGTCTTAT TATGGCTCGA TTCAGAGGTT CAAACTGGAA 
AAAATCTCGT CGTTTAGGTA TCTCTTTAAG CGGTACTGGT AAAGAATTAG AAAAACGTCC 
1S TTACGCACCA GGACAACATG GTCCAAACCA ACGTAAAAAA TTATCAGAAT ATGGTTTACA 

ATTACGTGAA AAACAAAAAT TACGTTACTT ATATGGAATG ACTGAAAGAC AATTCCGTAA 
CACATTTGAC ATCGCTGGTA AAAAATTCGG TGTACACGGT GAAAACTTCA TGATCTTATT 
20 AGCAAGTCGT TTAGACGCTG TTGTTTATTC ATTAGGTTTA GCTCGTACTC GTCGTCAAGC 

ACGTCAATTA GTTAACCACG GTCATATCTT AGTAGATGGT AAACGTGTTG ATATTCCATC 
TTATTCTGTT AAACCTGGTC.-AAACAATTTC -AGTTCGTGAA AAATCTCAAA AATTAAACAT 
25 CATCGTTGAA TCAGTTGAAA TCAACAATTT CGTACCTGAG TACTTAAACT TTGATGCTGA 

CAGCTTAACT GGTACTTTCG TACGTTTACC AGAACGTAGG GAATTACCTG CTGAAATTAA 
CGAACAATTA ATCCGTTGAG TACTACTCAA GATAATACGG TCAATACCAA CACCCACAAT 
30 TGTGGGTGT 

(2) INFORMATION FOR SEQ ID NO: 181: 

(i) SEQUENCE CHARACTERISTICS: 
35 < A ' LENGTH: 698 base pairs 

(B) TYPE: nucleic acid 
• _ (C) STRANDEDNESS : double ■ 

(D) TOPOLOGY: linear 



40 
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(xi) SEQUENCE DESCRIPTION,: SEQ ID NO: 181: 
AAATCCCTTt GTtaAAgTsC AAAtTTTTCc AACrgCTTTA AtArGACCCA TATTACCtTC 
4s TTGGATTAAA tCmAGGaATG AcATACCACG ACCaCGTATC TTTTAGCAAT ACTTACAACT 120 

AAACGTAAGT TCGCTTCTGC AAGTCTTGAT TTTGCTACTT CATCACCTTG TTCAATACGT " 180 
TTGGCTAATT CGATTTCTTC TTGTGCACTT AATAAGTTAA CACGCCCAAT TTCTTTAAGG 
so TACATACGAA CTGGGTCATT TATTTTAACA CCTGGAGGGG CACTAAGATC ACTTGGATTC - 

AGTTTCTCGT CAGTATCTGA ACTATCTTTT TCATTAACTA GTGAAATATC ATTATCATTT 
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GCAATTTCTT CATGACTTAA ATGACCCTCT TTTTTACCTT TTTCAATTAA TTGCTTCTTA 4 80 

ACATCTTCTA ATGTTAATGT CGGATCAATT GTTTGTTTTT TAATTTTAAC TGTGTTATCA 540 

GACATGAAAC GGCCTCCCGA TTTTAAATAT GAACATTCGA AATTTATTCA ATATTGCTAT 600 

TTTAAACGAA ATTCTTAATT AATTCCATCC ATATTTTnAA TTTTATTTTA CAAATTGGGA 660 

ACTAAATCCC CAATATTTAT TTTTCAATAG TGGTGGTT 698 
(2) INFORMATION FOR SEQ ID NO: 182: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5147 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



20 (3ci) SEQUENCE DESCRIPTION: SEQ ID NO: 182: 

ACTTGATGAT GTATACAATG TATTTCAAGA ATATTATCAA AAAACATCTA ACATTAAGTT 60 

TTGTAGAATT CACAATTCTA GCTATTATCA CTTCTCAAAA TAAAAACATC GTTCTTCTTA 120 

25 AAGATTTAAT TGAAACAATC CACCATAAAT ACCCTCAAAC TGTTAGAGCT CTCAATAATT 180 

TAAAAAAGCA AGGCTATCTA ATAAAAGAAC GCTCAACTGA AGATGAAAGA AAAATTTTAA 240 

TTCATATGGA TGACGCG CAG CAAGACCATG CTGAACAATT ATTAGCTCAA GTGAATCAAT 300 

30 TATTAGCAGA TAAAGATCAT TTACATCTTG TTTTTGAATA ATATCTCTAT TACG CAAGTG 360 

TGCTGTATTC TAAAGTGCAC TTGTGTTTTC TATTTTTTAA TAAAACCTCA GCACATAATG 420 

AACAACTTTC TATTTTCTAT ATCACTTAAA ACCATTTCCG AAATTAAACC TCAGCACATT 480 

CAAAGCCCCA CTTTATTCTT AAAAATATTT TTTAACTCAT ATGTATTAAA CCGCTTTCAT 54 0 

TATAAAAAAT ATCTCTATAT TtTATCTGtT TtTATTAATC GAAATAGCGT GATTTTGCGG 600 

TTTTAAGCCT TTTACTTCCT GAATAAATCT TTCAGCAAAA TATTTATTTT ATAAGTTGTA 660 

AAACTTACCT TTAAATTTAA TTATAAATAT AGATTTTAGT ATTGCAATAC ATAATTCGTT 720 

ATATTATGAT GACTTTACAA ATACATACAG GGGGTATTAA TkTGAAAAAG AAAAACATtT 780 

ATTCAATTCG TAAACTAGGT GTAGGTATtG CATCTGTAAC TTTAGGTACA TT ACTTAT AT 840 

CTGGTGG CGT AACACCTGCT GCAAAtgctG CGCAACACGA TGAAGCTCAA CAAAATGCTT 900 

TTTATCAAGT CTTAAATATG CCTAACTTAA ATGCTGATCA ACGCAATGGT TTTATCCAAA 960 

GCCTTAAAGA TGATCCAAGC CAAAGTGCTA ACGTTTTAGG TGAAGCTCAA AAACTTAATG 1020 

ACTCTCAAGC TCCAAAAGCT GATGCGCAAC AAAATAACTT CAACAAAGAT CAACAAAGCG 1080 
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AAAGTCTTAA AGACGACCCA AGCCAAAGCA CTAAOGTTTT AGGTGAAGCT AAAAAATTAA 
ACGAATCTCA AGCACCGAAA GCTGATAACA ATTTCAACAA AGAACAACAA AATGCTTTCT 
ATGAAATCTT GAATATGCCT AACTTAAACG AAGAACAACG CAATGGTTTC ATCCAAAGCT 
TAAAAGATGA CCCAAGCCAA AGTGCTAACC TATTGTCAGA AGCTAAAAAG TTAAATG AAT 
CTCAAGCACC GAAAGOGGAT AACAAATTCA ACAAAGAACA ACAAAATGCT TTCTATGAAA 
TGTTACATTT ACCTAACTTA AAOGAAGAAC AACGCAATGG TTTCATCCAA AGCCTAAAAG 
ATGACCCAAG CCAAAGCGCT AACCTTTTAG CAGAAGCTAA AAAGCTAAAT GATGCTCAAG 
CACCAAAAGC TGACAACAAA TTCAACAAAG AACAACAAAA TGCTTTCTAT GAAATTTTAC 
ATTTACCTAA CTTAACTGAA GAACAACGTA ACGGCTTCAT CCZAAAGCCTT AAAGACGATC 
CTTCAGTGAG CAAAGAAATT TTAGCAGAAG CTAAAAAGCT AAACGATGCT CAAGCACCAA 
AAGAGGAAGA CAATAACAAG CCTGGCAAAG AAGACAATAA CAAGCCTGGC AAAGAAGACA 
ACAACAAGCC TGGTAAAGAA GACAACAACA AGCCTGGTAA AGAAGACAAC AACAAGCCTC 
GCAAAGAAGA CGGCAACAAG CCTGGTAAAG AAGACAACAA AAAACCTGGT AAAGAAGATG 
GCAACAAGCC TGGTAAAGAA GACAACAAAA AACCTCGTAA AGAAGACGGC AACAAGCCTG 
GCAAAGAAGA TGGCAACAAA CCTGGTAAAG AAGATGGTAA CGGAGTACAT GTCGTTAAAC 
CTGGTGATAC AGTAAATGAC ATTGCAAAAG CAAACGGCAC TACTGCTGAC AAAATTGCTG 
CAGATAACAA ATTAGCTGAT AAAAACATGA TCAAACCTGG TCAAGAACTT GTTGTTGATA 
AGAAGCAACC AGCAAACCAT GCAGATGCTA ACAAAGCTCA AGCATTACCA GAAACTGGTG 
AAGAAAATCC ATTCATCGGT ACAACTGTAT TTGGTGGATT ATCATTAG CC " TTAGGTG CAG 
CGTTATTAGC TGGACGTCGT CGCGAACTAT AAAAACAAAC AAT ACACAAC GATAGATATC 
ATTTXATCCA AACCAATTTT AACTTATATA CGTTGATTAA CACATTCTTA TTTGAAATGA 
TAAGAATCAT CTAAATGCAC GAGCAACATC TTTTGTTGCT CAGTGCATTT TTTATTTTAC 
TTACTTTTCT AAACAACTTC TGAAACGCCT CAACACTTTC TACT CTGATT ACATATATGA 
CATTTTTAGG CATTAAAAAA TCGAACTAGA CAAGATGCTC ATTGCATTTC GTACTAGTTC 
GATTCATGAA TAATTAGATT TAAAATGTCA TTTGAATCCA AGTGACAACA TTATTTATAT 
TTAGAATATT AACGTTAGTA TAAACGTC CA AACACAAATA AAAGCAACAA ATATAATACT 
GTATTTTAAC GT CATTTTTA ATAATGCAGA TTCTTCACCA ACTTTTTTAA CAGCTGCAGT 
CGCAATGGCA ATTGATTGTG. GTGAAATAAG TTTCGCTGCT ACACCACCTG CAGTGTTAGC . 
TGCCACAAGT AATGAACCGC TTGTTGAAAT TTGTTGTGCC ACTGTCGCTT GAATAGGTGC 
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55 



865 



10 



15 



EP 0 786 519 A2 

TGGAGAGAAT AATGGGAAAA TTGCTCCCGC TTTAGCAATA CCTTGTCCAA TTGCTACAGT 3000 

CAAACCACCG TATGTCATAA CTTTAGCAAT AGCTAGGATA GCTGAAATTG TAAGGATCGG 3060 

TAACCATAAT TCTTTAATTG CTTCGACCAA TAAAGCACCT GCAGTTTTCG ATTTTAACTT 3120 

CGTAATTAAA ATTGTAATAA TTACTGTTAA TAAAATCGCT GTCCCAGTTG CACCAATTAA 3180 

ATCGAGACGC AACGCAATTC GTTTAGGCGA TAAATCACTC ACAGTATTTG GAATTGGCAA 3240 

TTTTATTACT AAACTTTCAA GTGCACCTCC AGGTTGGAAT AATTTTTTGA AGAATGGTGC 3300 

ACTCCATACT AATACAAAGG CAGTTAAAAT TACGAACGGA CTCCAAGCAA AGACAATTTC 3360 

TTTAGGCGTT CGTTTTTGAA TTTTATGTTC AGACGCTTCC AATCTGAAAA TGTTTTTCGG 3420 

TTTAAATTTA CGACAAACAA ATGCTAACAC CACCATTGTT GCTAGTGATG GAATAATGTC 3480 

TGCTAGTTCT GGACCATGGA ATATTGTTAA TAATAATTGT AATCCAGTAT ATGTACCACT 3540 

20 CACTGTTAAA ATGACAGGTA AAATTTCTTT AATACCTTTC ATACCATCTA CAATGAATAC 3600 

TAAAACAAAT GGAATAATAA AGTTTAAAAT TGGAAGTGTT AATGCTGAGT ATCTCGCAAC 3 660 

ATCTAATGTT GTAACGCCTC CACTTAAGTT AAACGTATCA ATAATACTAA CTGGTAAACC 3720 

25 

AATTGCACCA AAGGCACCCG CCGCACCATT AGCAATTAAA CATAACATCG CTGCTTTTAA 3 780 

TGGTTCAAAT CCAAGTTGAA TTAATAATAC TGCACAAATC GCAATTGGCA CACCAAATCC 3840 

TGCTGCACCT TCTAAAAATG CGTTGAAACA AAATCCAATT AATAATAGTT GGATTCTTTG 3 900 

30 * . 

GTCCACTGAA ATACTTGCAA TACTATCTTG AATAATAGAA AATTGTCCTG TTTTAATAGA 3 960 

AACTTTATAT AACCAAACTG CCATTAAAAC GATATATCCT ATTGGGAAAA TACCGGCAAC 4 020 

35 AACGCCTTCT GTAATCGCAC CTGCTGATAC ACGCGCTGGT AATTCAAATA CAAATAAAGC 4080 

CACAATCAAT GTAACAACCA AAGTTGTCAA TGCTGCATAA ATGCGTTTCA TTTTAAAAAC 4140 

GGTT&AGCAT AATAAAAATA AAATAATAGG TACTGCTGCA ACTAAGGCTG ATAATCCGAC 4200 

ATTATCGAAT GGATTTACAG TAAGTAGTGT CATAATGACT CCCTCTCTTT ATATAAAATA 4260 

TTT ATCATTC TGATTAATCT ACAACCTATT TCAACTTATA TTTTGCGATG ATCACATATT 4320 

TAAAATGTAA CACTC CTAT A TGTGACAGGC AATCGAATTT TTACAAAAAG TTCACAAAAT 43 80 

45 

ATACACAATA TTTAACTATA ATAmATAATA TATCaTlltTA ATTATAAATA CTAGATATTA 444 0 

TTTATAATAA TCTCAGGAAT TCGCTTCAAA ACTGCATCAT GAGAGTTTAT ATTTTTATTG 4500 

so AGAATCTCTC ATTTTATGAA TTGTAGGAAG TAAACAAAAT ATGACAAGCG TCAAACCAAT 4560 

G AT AATGATA AATATCATAT TAAACCATAG TAAATTGAAT TGATGATGGT GTTGTATTTG 4620 

CCAAATTTCT AATACTGTGA AGATAGACAT ATAGCTCATA ATCTCTAAAT TTAACGTACT 4680 
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AAATCGTTCA TAGTATCTAC CTGCAATGAA AAATATAAGC CAAATCACTA XAAATGCGCT 
ATTAATCAAA AGCAGCACCC ATTTATCAGC AAAATTATCA GCATCCCCTG CTAAATTATA 
ATGAATAGGC ACTTTGGTTG GTAATTTTGG ATAGGTCACT ACTGTATAGC ACATCATAGC 
TAAGTAAATA AGTAGACTTA ATATTGTAAA AGACCTGATT TTAGACATTC TATCGCCTcT 

^ TcTTTACATT TTATGTATAA CACTCTGCCT ATTTTAGCTT TTAATaCATT ACCCCAAcGA 

TtAAaCAATA tGTAaTGATA CTATAATTGC GTCAGGAGTA TCOGCTTGTT AAATGTGCAT 
AGCTTATATT TAGCTGTTTA ACATGCCACA TAATGATTCG AATTATT 

1S (2) INFORMATION FOR SEQ ID NO: 183: 



20 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1312 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 183: 

2S 

CACTTACTTC CACCATTATC ATAACTTTAA AATGGATATA nTTCATCAAA CATTATCTAA 
AGGCGTCGCA CCTACACCAA CACCATCCAA CAATTAACTT ACAACTCTGC GATTACTTCT 

3Q TCAGCAGCAA CTTTCACnTG CGTAATACAA TCAGGTAGTC, CAACCGCTTC AAAAGATGCA 

CCAGTTACTC TAAGTCGTGG ATATGTTTGT TTAATATGTG CTTGAATCTG TCTAATTTGT 
TGAATATGAC CGACATGGTA CTGTGGCATA CTTTTCGGCA AACGATTGAC AATTGTAAAT 

3S TCAGGATCAC CTTTAAATGT CATCATTTGA CTTAAATCTC TACGTACAAT CGATACTAAT 

TCATTATCTG TATGATCATC AACCACAGTA TCACCTGGTT TACCTACATA CGCACGAATC 
AAAmCTTAC CTTCCGGTGT AGTAAATGGC CATTTTTTCG ATGTCCAAGT ACATGCGGTA 

40 

ATGTCTGTAT CACTCGTTCT CGCAATTACG AAGCCAGTAC CATCATGGGT ATTTTCAATG 
TCTTTTTCAT CAAATGCCAA TACAACAGTT GCAACAGTCG TACTATCCAT CGTTTTAAAG 
4S TAATCAAATG CTGGATCTTG TCCGAACCAA TTTAAAAACA CTTGATGTGG TGTCGTTACT 

AATACGCCAT CATACACTTC TTCTAGTTGA TCATTGTAAA CAATTTTATA TTGTTTTTGA 
GATGTAATTA TATCATCCAC TGACGTATTG TAGCGTATTG TCACACCTTT ATTTTTAACA 
so TCTTGTTCTA ATGCTTCAAT AAATGAGCTT AAACCATGCT TAAATTGTTT GAATTGTCCT 

TTCGGTGCGC CAGGATATAA TTGTCTTTGT TTCAGACGCT TATTTTTCTC ATCCTTCATA 
CCTTTTATCA GACTTCCGAA TGCCTCTTCT TTTTCTTTAA AATTAGGAAA CGTACTCATC 
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TCAAGTACCT CATTACCTAA TCTTGCTCTG AAAAATGCAC CAACAGAAAT GTCACCATCC 10 BO 

TGCATTTGAG TAGGTTTTTT TAATAAATCA AACCCTGCTC TTAATTTACC AAGTGGCGAT 114 0 

ATTAATTTTG TAGTAACAAA TGGTTTAATA TCTGTTGGAA TACCCATAAT TGAACCACCT 1200 

GGAATCGGAT ATAATTTATT TTTCGCAAAA ATATATGATT GTCCAGTCGT ATTTGTAACA 1260 

ATATCTTGTT CTAATCCAAT ATCTTTCGCT AATTCTGTCA TAATCGTTTT TC 1312 



10 

(2) INFORMATION FOR SEQ ID NO: 184: 

Ci> SEQUENCE CHARACTERISTICS; 

(A) LENGTH: 6157 base pairs 
<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



20 ( x i) SEQUENCE DESCRIPTION: SEQ ID NO: 184: 





TTTTACAATA 


AAAATATGAT 


ATACTACTTG 


TCGTATATAA 


GGAACGGAGG 


ACAATTTATG 


60 




CATACATTTT 


TAATCGTATT 


ATTAATCATT 


GATTGTATTG 


CATTAATAAC 


TGTTGTACTA 


120 


25 


CTCCAAGAAG 


GTAAAAGCAG 


TGGACTTTCA 


GGTG CCATCA 


GTGGTGGTGC 


TGAGCAGTTA 


180 




TTCGGTAAAC 


AAAAACAACG 


TGGCGTCGAT 


TTATTCTTAA 


ATAGATTAAC 


AATTATTTTA 


240 


30 


TCAATATTAT 


TTTTTGTACT 


TATGATTTGC 


ATAAGTTATC 


TTGGTATGTA 


AGGTCCGGCG 


300 


ATGTAAATGT 


CGGGCTTTTT 


TATTTATAAT 


TAAGAATGTA 


ATAGTTTAAC 


AATAAGCTAT 


360 




GTAAAATATA 


TAGCCTAGTT 


AAGTATGCAA 


AGGGAGCGTT 


AGATTTATGC 


AGATAAAATT 


420 


35 


ACCAAAACCT 


TTCTTTTTTG 


AGGAAGGTAA 


ACGTGCCGTG 


TTATTACTAC 


ATGGTTTTAC 


480 




AGGCAATTCG 


TCTGATGTTC 


GTCAATTAGG 


TCGATTTTTA 


CAAAAGAAAG 


GTTATACATC 


540 




ATATDCACCG 


CAATATGAAG 


GCCACGCGGC 


ACCACCAGAT 


GAAATACTGA 


AATCTAGTCC 


600 


40 


TTTCGTTTGG 


TTTAAAGATG 


CGTTAGATGG 


TTATGATTAT 


CTTGTTGAAC 


AAGGTTATGA 


660 




TGAAATTGTT 


GTTGCTGGTC 


TATCATTAGG 


TGGGGATTTT 


GCTTTAAAAT 


TAAGCTTAAA 


720 


45 


T AGAGATGT A 


AAGGGTATTG 


TAACGATGTG 


TGCTCCTATG 


GGTGGCAAAA 


CTGAAGGTGC 


780 


CATTTATGAA 


GGCTTTTTAG 


AATATGCACG 


CAATTTTAAA 


AAGTATGAAG 


GTAAAGATCA 


840 




AGAGACTATT 


GATAATGAAA 


TGGATCATTT 


TAAACCAACT 


GAAACTTTAA 


AAGAACTAAG 


900 


50 


TGAAGCATTA 


GATACGATTA 


AAGAGCAAGT 


TGATGAAGTG 


TTGGATCCTA 


TTTTAGTGAT 


960 




TCAAGCAGAA 


AACGACAATA 


TGATTGATCC 


ACAATCCGCA 


AATTATATAT 


ATGACCATGT 


1020 




AGATTCTGAT 


GACAAAAATA 


TCAAGTGGTA 


CAGTGAATCT 


GGACATGTTA 


TTACGATTGA 


1080 
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AGAATAAAAA GAGATTTTAA CATTAGAAAG GAGGGG CATA ATGAATTTAA AGCAATCTAT 
AGAAGAGATT ATTAATCAAC CTGAATATGA ACCTATGTCA GTGTCAGATT TTCAAGATGC 
ATTAGGTTTA AGCAGTGCCG ACTCGTTTAG AGATTTAATT AAGGTGCTTG TGGAGTTAGA 
ACAATCAGGA TTAATCGAAC GTACAAAAAC AGACAGATAC CAAAAAAAGC ATAGTTATAG 
AGGTCAATCA AAATTGATAA AAGGAACGTT AAGTCAAAAT AAAAAAGGCT .TTGCATTCTT 
AAGACCTGAA GATGAGGATA TGGAAGATAT ATTTATTCCC CCGACGAAAA TTAATCGTGC 
CTTGGATGGA GATACTGTTA TTGTAGAAAT CCATCAATCA AAAGGTGAAC ATAAAGGTAA 
AATCGAAGGG GAAGTTAAGT CGATTGAGAA GCATTCTGTA ACTCAAGTTG TTGGTACGTA 
TAGTGAAGCT AGACATTTTG GCTTTGTTAT TCCGGATGAT AAACGTATTA TGGAAGATAT 
TTTCATTCCT AAAGGTCAAA GTTTAGGCGC AGTCGATGGT CATAAGGTAC TTGTACAAAT 
TACTAAGTAT GCTGATGGTT CAGATAATCC AGAAGGACAT ATTTCTGCTA TTTTAGGACA 
TAAAAATGAT CCTGGCGTAG ATATTTTATC TATTATCTAT CAACATGGCA TAGAAATTGA 
ATTTCCTGAT GAAGTGTTAC AAGAAGCTGA AGCAGTACCT GATCATATTG AAAATACTGA 
AATTAAAGGC CGTCATGATT TACGTGATGA ATTGACAATC ACAATTGATG GTGCTGATGC 
TAAAGACTTA . GATGACGCAA TTAGTGTTAA AAAGTTAGCG AACGGTAATA CGCAATTAAC 
TGTAAGTATT GCTGATGTCA GCTATTATGT AACAGAAGGT TCTGCATTGG ATAAAGAGGC 
ATATGATAGA GCGACAAGTG TATATCTTGT TGACCGTGTA ATTCCAATGA TTCCACATCG 
ATTAAGTAAT GGTATTTGTT CATTGAATCC TAATGTTGAT CGTTTAACTC TAAGCTGTCG 
CATGGAAATC GATGCTAGTG GTCGCGTTGT TAAACATGAA ATTTTTGATA GTGTTATACA 
TTCTGATTAT CGAATGACGT ATGATGCGGT AAATCAGATT ATTACTGAAA AGGATCCTAA 
CATTCGCGAA CAAT ATAATG AAATTACGCC TATGCTAGAT TTAGCACAAG ATTTATCTAA 
TCGTTTGATT CAAATGAGAA AACGACGTGG TGAAATCGAT TTTGATATTA GTGAAGGAAA 
AGTATTAGTT AACGAAGACG GTATACCAAC AGATGTTCAA TTAAGACAAC GTGGCGAGGG 
TGAACGTCTA ATTGAATCAT TTATGTTAAT TGCAAATGAA ACAGTTGCTG AACATTTTAG 
TAAGTTAGAT GTACCTTTTA TTTACCGAGT GCATGAGCAA CCTAAATCAG ATCGCTTAAG 
ACAATTCTTT GATTTTATTA CAAACTTTGG CATCATGATT AAGGGTACTG GCGAAGATAT 
TCATCCAACA ACACTTCAAA AGGTTCAAGA AGAAGTAGAA GGTCGACCTG AACAAATGGT 
CATTTCAACA ATGATGTTGC GTTCAATGCA ACAAGCGCAT TATGATGATG TGAACTTGGG 
ACATTTTGGC TTATCAGCTG AATATTATAC GCATTTTACA TCACCAATTA GACGTTATCC 
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AGAAGTGAAG CGTTGGGAAG ACAAATTGCC TGAGTTAGCT GAACATACTT CTAAACGTGA 3000 

ACGTCGTGCT ATTGAGGCAG AACGTGATAC TGATGaATTG AAAAAAGCAG AATATATGAT 3 060 

TCAACATATT GGTGATGAAT TTGAAGGTAT TGTCAGCTCA GTAGCTAACT TCGGTATGTT 3120 

CATTGAATTG CCAAATACGA TAGAAGGTAT GGTTCATATT GCGAATATGA CTGATGATTA 3180 

TTACCGTTTT GAAGAGCGTC AAATGGCATT AATTGGTGAG CGTCAAGCTA AAGTATTTAG 3240 

AATTGGTGAC ACAGTTAAGG TTAAAGTGAC GCATGTTGAT GTAGATGAAC GATTAATTGA 33 00 

TTTTCAAATT GTAGGTATGC CTTTACCGAA AAATGATCGA TCACAGCGCC CAGCGCGAGG 3360 

TAAGACAATT CAAGCCAAAA CGCGTGGTAA ATCATTAGAT AAATCAAAAT CTGATGATAA 34 20 

GGGTCGTAAG AAAAAAGGTA AGCAACGTAA AGGTAAAAAC CAACGTAATA ATGATAAATC 34 80 

AGGTAATAGT AAGCATAAGC CATTTTATAA AGATAAAAGT GTGAAAAAGA AAGCACGTCG 354 0 

TAAGAAAAAA TAAGCAGCAA TGAGGTGAGT ATGAATGGCT AAGAAGAAAT CACCAGGTAC 3600 

ATTAGCGGAA AATCGTAAGG CAAGACATGA TTATAATATT GAAGATACGA TTGAAGCGGG 3660 

AATTGTATTG CAAGGCACAG AAATAAAATC AATTCGCCGA GGTAGTGCTA ACCTTAAAGA 3720 

TAGTTATGCG CAAGTTAAAA ACGGTGAAAT GTATTTGAAT AATATGCATA TAGCAGCATA 3780 

CGAAGAAGGG AATCGTTTTA ATCACGATCC TCTTCGTTCT CGAAAATTAT TATTGCACAA 384 0 

GCGTGAAATC ATTAAATTGG GTGATCAAAC ACGTGAGATT GGTTATTCGA TTGTG CCGTT 3900 

AAAGCTTTAT TTGAAGCATG GACATTGTAA AGTATTACTT GGTGTtGCAC GAGGTAAGAA 3 960 

AAAATATGAT AAACGTCAAG CTTTGAAAGA AAAAGCAGTC AAACGAGATG TTGCGCGCGA 4020 

TATGAAAGCC CGTTATTAAG CGATTTAGTT GCTTAATCGG GCTATATTTG ATATAGTTAT 4080 

ATGTGCTTTT GTAAATTACA AAAGTATGAT TTGTTTGATT TATTATTTCG GGGACGTTCA 4140 

TGGATTCGAC AGGGGTCCCG CGAGCTCATT AAGGGTGTCG GAGGGTTGTC TTCGT CATCA 4200 

ACACACACAG TTTATAATAA CTGGGAAATC AAACAATAAT TTCGCAGTAG CTGCCTAATC 4260 

GCACTCTGCA TCGCCTAACA GCATTTCCTA TGTGCTGTTA ACGCGATTCA ACCTTAATAG 4320 

GATATGCTAA ACACTGCCGT TTGAAGTCTG TTTAGAAGAA ACTTAATCAA ACTAGCATCA 4380 

TGTTGGTTGT TTATCACTTT TCATGATGCG AAAGCTATCG ATAAACTAGA CACGTAGAAA 4440 

GATGTGTATC AGGACCTTTG GACGCGGGTT CAAATCCCGC CGTCTCCATA TTTGTAGCCT 4500 

ACAGCCTTTG TGGTTGTGGG CTTTTTTATT TTGTGTTTTT CAGGGGATAA TGCATTGCAG 456 0 

AATTTGTTGT GAGTATTGAT ATAGCAGTGT TTGTATAGGT GTTTATTTGA TGGAGGAAAG 4 620 

AGTAATAAGT GATTATGAAT TAGTTTTTGA GATATAAGGG GACAGTGATG TGTGTCAAAT 4680 
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TTATACGCAA AAAATTCTCC ATGTTATATA TC3TCAATATA AAAATGTGAA TCGTCTACAC 480i 

TTAATTGGAT AAATGGCTAC TGAAAAAGAA CTTTTCATTT TTGTTACGTC ACTAAGTGGG , 486( 

TGTAGTTATA AAGAGATGAG CCGAGTTTTG ATATTTTCAT TAGAATCAAT ATGCCTATTA 4 92 ( 

ACACAATCAG CAATAGTTGA CGAGACGGAA ATAAAAGAAG TCGTAGTTAA GAAATGCATT 498C 

^ TCACAACATA CCATTGTAGC CATTTTTATT GTTTTGGATG ATAAACTCTT TTTGGAATTT 504C 

TTAGTTTTTA TAATTTGCAA CTACACTACT TCTTTTACTA ATATTAATGT. CTAAGTAATC Sioc 

GATAAAAAAT TTTCCATTGA ATAAATGAGA AGTTAAAAAC TTTACTTAAC CTTTCycATT 5160 

1S GCATTTTCCT ATTCACGATT TTAAGAACCC AACATACTAC AAACGAATTT TAAAAGGGGA 5220 

GAGTAAAGCT TACTTGTTTA TTATACATAT TTAAAATCCA AGAGTCAGAA CAGACTACTC 5280 

CTCTTTATAA CTATAAAAAA TAGCTATGAA AAAATCTATC GTCATAGATT CCTTCATAGC 5346 

20 TAATCTTAGT ATGTTTATTT TTATTTTAGG ATGCTATTTA TCAACTCAAC ATATAACTCA 5400 
CTATTTTTAT AACCTTCTAA TATATCATTA ACTTGTCTAA TAGGTATTTC TGGTACTTCT . 5460 

CTAATGTTTT CCAATTTTGT TTTAAATTGT TTTTTTGTTA TTTGCTCTTT ATTTGTAGCC 552 0 

AATTGGAACA AGTAAGAATC TAGCATATTA ATTTCTTTAT ATGAATACAT ATATCTTAAT 5580 

AACACTAAAT CTCTAGTTTT TAAGTTAGGC GCTAGTTCTT CTTGTAATTG TTCTATTGAT 5640 

TGTyTCATTA ATAACAATCT CATTTCTAAT TCTTCATTAT TCATTTTATC ACACTCTTtT 5700 
TATATTAATG CTTGACCAAC TTGGGAAACC CAAAACCCTA TGCTTCTTGC AGTAGAATCT 
TTAATACCAG TTCCCATCAA TGCTTGTGAA ACTTGACCTT GTACATTTCC CCATGTAGCC 
3S TCTTCTTGTT TTAATGCATT ATTCAATGCG GGATTTACAA ATTTATCCCA TCTTTTTTTT 
ATGATTTTCC GGCACGGGGA CTGATTTCTT TAACACCATT AAACACAGAT TTTTTATTTT 
TAATCATAGC TTTATAGTAT CATGTTGGCT AAGCTATAAA TAAGTCAGTT TCTCTAAAAA 
TTASATAACT GAATGTAAGA CAATCAACAA wCCAAATTTA TACTTCATCT AAACCACTGT 
GGTCGTCATC TTTTTGCTTT TCTTTTTCTT TCTCTCGTTC TTGTTCTTTT TTGTACTCTT 



5760 
S820 
5880 
5940 
6000 
6060 ' 
6120 

CTTCAAATTC TTTTTCTTTC TTTTCTACTT CTTCTCT , e , 

45 6157 

(2) INFORMATION FOR SEQ ID NO: 185: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 884 base pairs 
so (B J TYPE: nucleic acid 

(C) STRANDEDNE SS : double 

<D) TOPOLOGY: linear 
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CATTTGTTAT 


TCTGAGTAGC 


CAATTTGGCA 


AAGATGAACA AACGTCTGAA 


CAAACGTATC 


AAGTTGCAGT 


CGCATTAGAG 


TT AATT CAT A 


TGGCAACACT 


TGTTCATGAT 


GACGTTATTG 


ATAAAAGCGA 


CAAGCGTCGA 


GGCAAGTTAA 


CCATATCAAA 


GAAATGGGAT 


CAGACAACTG 


CTATTTTAAC 


TGGGAATTTT 


TTATTGGCAT 


TAGGACTTGA 


ACACTTAATG 


GCCGTTAAAG 


ATAATCGTGT 


ACATCAATTG 


ATATCTGAAT 


CTATCGTTGA 


TGTTTGTAGA 


GGGGAACTTT 


TCCAATTTCA 


AGACCAATTT 


AACAGTCAAC 


AGACAATTAT 


TAATTATTTA 


CGACGTATCA 


ATCGCAAAAC 


AGCACTGTTA 


ATTCAAATAT 


CAACTGAAGT 


TGGTGCAATT 


ACTTCTCAAT 


CTGATAAAGA 


GACTGTACGA 


AAATTGAAAA 


TGATTGGTCA 


TTATATAGGT 


ATGAGCTTCC 


AAATCATTGA 


TGATGTATTA 


GACTTCACAA 


GTACCGAAAA 


GAAATTAGGT 


AAGCCGGTCG 


GAAGTGATTT 


GCTTAATGGT 


CATATTACGT 


TACCGATtTT 


ATTAGAAATG 


CGTAAAAATC 


CAGACTTCAA 


ATTGAAAATC 


GAACAGTTAC 


GTCGTGATAG 


TGAACGCAAA 


GAATTTGAAG 


AATGTATCCA 


AATCATTAGA 


AAATCTGACA 


GCATCGATGA 


GGCTAAGGCA 


GTAAGTTCGA 


AGTATTTAAG 


TAAAGCyTTG 


AATTTGATTT 


CyGaGTTACC aGATGGACaT 


CCGaGAC CAC 


TACyTTTAAG 


TTTGACGAAA 


AAAATGGGTT 


CAAnAAACAC 


GTAGTATTTA 


TGnAAAAGTA 


TTGAAAGCGC 


TTTACCAACC 


TGTTAATATA 


TAATAGTAAT 


ATAC 





< 2 ) ; INFORMATION FOR SEQ ID NO: 186: 

Ci) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6 875 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

- <xi) SEQUENCE DESCRIPTION: SEQ ID NO: 186: 
AATTTCATCT GCTCGTGCAA AATCTTTGTT TTTCCTTGCT TCATTACGCT CTTCGATTAA 
TTTTTCAACA TCTTCATCCA ATAATTCATC TGCATTTITA GATTTTAACG GTACACCTAA 
AACATCGCTG AAAATTTGAT AAACTGCTTT AAATTTATCA ATTACTTCTG TTGATGTTGT 
GTTCTCTAGT ACATATTTAT TCGCAAGTkT TGCTAAATCA TACCAAGCTG TAATTGCATT 
AGCTGTATTA AAATCATCAT TCATAACTGT TTCAAAACGA TTTAAAATCG CATCAATTTG 
ATCAATATAT GTCTGTTGAT TTTCAATATT AGTAGCAATT TGTGCGCGCT CTTCAATTAA 
TTGATAACTA TTGCGAATAC GCTCTAGTcC aCTACGTGCT GATTCTACCA ATTCTAGATT 
ATAGTTAATT GGGCTTCTAT AATGTACGCT AATCATAAAG AATCTTAGTA CATCTGGATC 
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15 



20 



25 



30 



35 



40 



45 



50 



ATTATCAATA TTAATGAAAC CATTATGCAT CCAATAATTA GCAAATGGCG CATGATTATG 
TGCTTCTGAT TGTGCTATTT CATTTTCATG ATGTGGAAAT TGTAAATCTG AACCACCCGC 
ATGTATATCA ATTGTAGGTC CTAGCTCATG AAATGCCATT ACAGAACATT CTATATGCCA 
TCCTGGTCTA CCTTCACCAA ATGGGCTATC CCAAGTAATC TCGCCAGGTt CGCTTTTTTC 
CACAATGTAA AATCAAGTGC ATCTTCTTTA TGCTCTCCTG CATCTATACG AGCACCCACT 
TTTAAGTCAT CTATGGATTG ATGACTTAAT TTACCATAAC CTTCAAATTT ACGTCTTCTA 
AAGTAAACAT CGCCACCACT TTCATATGCA TAACCTTGAT CCACCAAATC TTTAATAAAT 
TGAATAATGT CATCCATATG GTCCATTACC CTTGGATTTG AAGTCGCTTT TCTAACATTT 
AACGCACCAA CATCTTCATG AAAAGCAGCG ATATATTTTT CTGCAATTTC GGGAACAGAC 
TGATTTAATT CTTGAGAACG TTTAATTAAT TTATCATCTA CGTCTGTAAA ATTTGATACA 
TATTCTACAT TATATCCTTG GTATTCAAAG TAACGTCTCA CTACGTCATA ATTAATTGCw 
GGTCTTGCGT TACCAATATG AATGTAGTTA TATACAGTAG GACCACATAC ATACATTTTT 
ACTTTCCCTG GTTCTATAGG CTTGAACACT TCTTTTTGAC GTGTAAGCGT ATTATATAAT 
GTAATCATCT TGAATCTCTC CATTCCTAGT CTTTTCAAGT TGTCGTTCTA AATGCTTAAT 
TTGTTCATAA ATTGGATCAG GTAGATGGCG ATGATCAAAT GTTTTTCCAA CTCGAACACC 
ATCTTGCTTA ACAATATGTC CTGGTATACC AACAACCGTT GAATAACTTG GAACTGATTG 
TAAAACAACT GAATTTGCAC CAATATTTAC ATTTGAATTT ATTTTAATAT TTCCTAAAAC 
TTTCGCACCG GCTGCTATTA AAACATTGTC TCCTATATCT . GGGTGTCTTT TCCCTCTTTC 
TTTCCCTGTC CCACCAAGTG TCACGCCTTG ATAGATTGTC ACATTATCAC CAATTGTACA 
TGTTTCTCCT. ATTACAACGC CCATACCATG ATCTATAAAT AGACGCTTTC CAATTTTAGC 
ACCFGGATGG ATTTCTATAC CTGTGAAAAA TCTTGAAATT TGAGATATCG CGCGTGCTGC 
AACATATTTT TTTTGGTTGT ATAACTTATG TGCAATCAAA TGACTCCAAA CTGCATGTAA 
ACCTGCATAC GTTGTAATGA CTTCTAATGT TGAACGTGCC GGTGGATCCT GCTCAAATAC 
CATTTTTATA TCGTCTCTCA TTCTTTTTAA CAAGATCATT TCCTCCTCAA TGATTGAACT 
ACGTAAATAC ATAATTGAAG TACCTGCGAA ATTAAATATC AAAAAAGCAC CACTAACATA 
CAAATTGTAT TGTTAGAGGC GCTTCCGCAC GGTTCCACTC TGAATTTAGC GAATAACATT 
AATAATATTG CGGGCGCTTC CAAATTATCA AGGAAACTAA GTCAACTTAA TGCTCATGAC 
TCTCATTATA TATTTAATTC ATTTTACGAA GGTGCATTCA TTAATTTCTA CGTTGT ACTC 
ACAG CAACCG TACACTCTCT GCATCGTATA AATTTAATTA CTAATCCTTC GTTTTATATA 



600 
• 560 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1S00 
1560 
1620 
1680 
1740 
1800 
I860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
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5 



10 



IS 



2S 



30 



3S 



ATAAAATTCA 


AGTATATAGT 


ACCTTGATCT 


TGTCTATTTC 


ATTACTTATA 


TTGTTTTAAA 


2400 


CGGTTTAGCA 


CTTTTTCTTT 


ACCAAGTACT 


TCAATTGTAT 


TTGGTAATTC 


AGGACCATGC 


2460 


ATTTGGCCTG 


TTACAGCAAC 


ACGAATAGGC 


ATAAATAATT 


GCTTGCCTTT 


TATTCCTGTT 


2520 


TCTTTTTGAA 


CTTCTTTAAT 


TGTCTTTTTA 


ATTTCAGCCG 


CTTCAAATGG 


TTCAAGTGCT 


2580 


TCTAATTTAC 


TGAATAAGTG 


CGTCATTAAC 


TCTGGTACTT 


GCTCTCCATT 


AATCACTTGT 


2640 


TGTTCTTCTT 


CACCAAGAGC 


TGGCATTTCT 


TTAAAGAACA TTTCTGATAA 


AGGTACAATT 


2700 


TCACCGGCAT 


AACTCATTTC 


TTTTTGATAA 


AGGGCAATTA 


ATTTGCGTCC 


CCAAGATAAA 


2760 


TCCTCTTCTG 


ACGGCACCTC 


AGGAATCAAA 


TTTGCTTTAA 


TTAAATGAGG 


TAATGCTAAT 


2820 


TGGAATACTG 


TTTCAGTATC 


TTTTTGTTTC 


ATATATTGGT 


TATTAACCCA 


. TGCTAATTTT 


2880 


TGCTTATCGA 


AAAATGCTGG 


TGATTTTGAC 


AAACGCTTTT 


CATCAAAGAT 


TTTGATAAAT 


2940 


TCTTCTTTAG 


AAAAGATTTC 


TTCTTCACCT 


TCAGGAGACC AACCTAATAA 


CGCAATAAAA 


3000 


TTAAATAACG 


CTTCAGGTAA 


ATAACCTAAG 


TCACX3ATATT 


GCTCAATAAA 


TTGTAAAATT 


3060 


TGCCCATCAC 


GTTTACTTAA 


CTTTTTACGT 


TCTTCATTAA 


CAATT AATG A 


CATATGACCA 


3120 


AAACGAGGTG 


GCTCCCAGCC 


AAATGCTTCA 


TAAATGATAA 


T1TGTTTAGG 


CGTGTTTGAA 


3X80, 


ATATGAT CAT 


CACCACGAAT 


TACATCTGAA 


ATTTGCATGT 


AATGATCATC 


TATAGCTACT 


3240 ( 


GCAAAATTGT 


ACGTTGGAAT 


GCCATCTTTT 


TTTACGATAA 


CCCAGTCACC 


AATACCATTT 


3300 


GAATCAAATG 


AAATATTTCC 


TTTTACCATA 


TCATCAAATG 


AATACGTTTG 


GTTTTGAGGT 


3360 


ACTCGGAAAC 


GAATTGATGG 


TTGGCGTCCT 


TCTGCTTCAA 


ATTGTTGACG 


TTGTTCTTCA 


3420 


GTCAAATGCG 


CATGTTGACC 


ACCATAGCGA 


GGCATTTCAC 


CACGAGCGAT 


TTGCGCTTCA 


3480 


CGTTCAGCTT 


CTAATTCTTC 


TTCTGTCATA 


TAGCATTTAT 


ATGCTTTATC 


TTCTGCTAGT 


3540 


AACTCATCTA 


TTAATGGTTG 


GTAGATATGT 


TGACGTTCAG 


ATTGACGATA 


TGGTCCGTAG 


3600 


CCATTGTCTT 


TATCT ACAGA 


CTCATCCCAA 


TCTAATCCTA 


ACCATTTAAG 


ATTATCAAAT 


3660 


TGTGATGTTT 


CTCCATCTTC 


TAAATTACGT 


TTTTTATCAG 


TATCTTCAAT 


TCGAATCACA 


3720 


AAATCTCCGT 


TGTAATGTTT 


AGCATACAAG 


TAATTGAATA 


ATGCTGTTCT 


TGCATTACCA 


3780 


21 *P & Tfl A 21 fl 21T 
A Art. 1 1 




ACTTGGTGCA 


TATCTTACTC 


TTATACGATC 


GCTCATTTTT 


3840 


TTCACTCCTA 


AATTAAATAT 


CAGATTTTCA 


AGTTAGTTCA 


TATAAATTGT 


TCATTTGCTA 


3900 


TCTTCGACCG 


TCATAACAAA 


TGTCTAACTC 


GTCTTATTGT 


TAAAACGAAA 


CAATGCTTTT 


3960 


TAACATGACC 


TTAAAATAAT 


TTCATTGTTT 


AATCATAACA 


TAATTCCCTG 


GGTAATATGC 


4020 


TTAAATTTTA 


AATAGAAAGC 


TGTTGTTTTT 


TCAACACTTT AAAAAAGCTA 


TCCGTAAGAA 


4080 
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40 



45 



TTAAACTTCA AATTAACTAT TCAAATACGT TAAAATTGAT TCTAATTTTO TATCTCTTGA 
TTGCTATAAG AATAACTTTA TTAATATCTA AAATTTAACA CTTAATGAAC TTGTTTCAAT 
GATATATTAG CACTATTTGT ATTTTTTGAT AACTAATATG TTTTGCATTT ATTTATAGTT 
ATACTTCAAA TTACAAACTt CGCCATTTCA TATACCTTTT AATATCTATT TTGTTTTCGT 



4200 
4260 
4320 
4380 

CAACTACAGT TTTTATAATG ATACTGTATC TTCGATTTTT TTAGCAAAAA CAATTCTTCC 



10 nun-iuiniv. lawraiT TTAGCAAAAA CAATTCTTCC 4440 

TGAAGATGTT TGCAATAAGC TGACTACTTC TAAATTGACA TGACTGCCAA TAAGATTTTT 
AGCATTATCA ACAACTACCA TCGTACCATC ATCTAGATAT CCTACTGCCT GACCAGGCtC 
1S CTTACCCATT TTTGTCAGTA AAATATGCAG TTGATCACCT TGATGTACAT TAGGTTTGAT 

TGCTTCTGAT AAATCATTAA CATTTAATGC TTTGATACCA TGTACATGAC AAACTTTATT 
TAGGTTGAAA TCTGTCGTTA TAATACTTGC ATGATATTGT TTTGCTAATT TTAATAACAT 
» CGTATCAATA TCACTATGTG TTTTAGTTGG ATGTATAACC TTTGTAGGAT AGTCTAAATC 

ATACAATTCA TTTAAAATAT CTAAGCCTCT TTTACCCTTT TCaCGTTTAA CACTGTCATT 
TGAATCTGCA ACAATTTGTA ATTCATTAAT AACACCTTGT GGAATTAAAA TATTGCCATC 
GATAAAACCG CAACGAATGA CTTCTAAAAT ACGACCATCA ATAATTGCGC ; TTGTGTCGAT 
AATTTTTGGC GTAgcaCTTT TaGTATGTTG TGACATGGAA CGCGCTATAT TCTCAGGTAA 
AAACATTAAC ATTTCATCTC GTTTTTTAAG GCCAAATTGG AAACCGAAAT AACATAGTAA 
TATCGTAATT. ATGACAGGAA TGAAATGATT AAAAATAGAG TTGCCAATTG ATTCTAATAT 
AAACGACACC ATAACAGAAA TAAGTAATCC GATTATTAAA CCTATTGTTG CGAATAGTAT 
35 TTCAACAGCA CTTCTACGCA TAATAAAATG TTCTAAACCT TTTATAGCGT TAGTAACTCG 

TCTAATAAAT ACACCAAAAA TTAAGAACAT AAAAATACTA CCGATAATGC CATCTACATA 
GTGATTTTTT AAAAAGCTGG AGTTTTGTAA TCCAAGATCA TTTGCAATTT CAGGAATAAT 
AATTATTCCT AATGCGCTCC CAATAATTAA GTAAATAATA ATAACCATTA GTTTAACGAT 
ATTCACACAA TGTCCTCCTT TCTTGATGTT TTATGAATGA AGAGCAAATG ACAATACTTC 
ATGTACAGTA GTTACACCTA TTACTTGTAT ACCTTCAGGA TATGTCCATC CGCCTATATT 
ATTTTTAGGA ATAATTACAC GTTTGAAACC TAGTTTTGCA GCCTCTTGCA CGCGTTGTTC 
TATCCGAGAT ACACGACGTA CCTCACCOGT TAAACCAACT TCTCCAATAT AGCAATCTAA 
TCCGTCGACA GCTTTATCTT TAAAGCTAGA TGCAGTTGCT ACAATTACAC TTAAATCAAC 
TGCTGGCTCC GTTAACTTTA CACCGCCAGC TACTTTGATA TAAGCATCTT GTTGTTGTAA 
TAGATAATTT TCTTTCTTTT CCAAAACAGC CATCAACAAA CTTAATCGAT TATGATCAAT 



5880 
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TATTAAAAGT GGTCTGGTTC CCTCCATGGT TGCAACAATT GTTGAACCTG GAACATTTGT 6000 

. TGAACGTTCT TCTAAAAACA TTTCAGATGG ATTATTTACA CCTTTTAATC CACTTTGCTT 6060 

s 

CATTTCGAAG ATTCcCATTT CATTCGTTGA ACCAAAACGG TTTTTAACAG CTCGCAAAAT 6120 

TCGATATGCG TGGTGTTCAT CGCCTTCAAA ATAAAGCACA GTATCaACCA TGTGTTCTAG 6180 
CAATCTTGGG cCCAGCAATT TGACCTTCTT TCGTTACATG ACCCACTATA AAAGTTGCaA - 6240 

10 

TGTTCATTTG TTTAGCAATA TTCATTAAAC TTTGTGTACT TTCACGAACT TGTGAAACAG 6300 

AACCTGGCGC AGAGCTGATT TCAGGATGAT ATATTGTTTG AATCGAATCC ACTACTAATA 6360 

15 AATCAGGTTG TTCTTCTTTT ACTGTTTGAT AAATAACTTC AAGATCTGTT TCAGCTAATA 6420 

CTTGCAATTC ACTTGAATCT TCATCTAATC GCTCTG CACG TAATTTAGTC TGACTAAGCG 6480 

ATTCTTCTCC AGTAATATAT AGTACTTTTT TCTTTTGAGA TAACGATGCA CAAATTTGTA 6540 

20 AAAGTAACGT TGACTTACCA ATACCTGGAT CCCCACCAAT AAGTACTAAC GATCCGCTCA 6600 

CAATACCTCC ACCTAATACA CGGTTGAATT CTGCTGAATC TGTTAACACT CTCGGCGTTG 6660 

TTTCATGTTT AATACTATTT AATTTTTGTA CTTTACCTGC TAATTCCTTG GTTTTAACTC 6720 

25 

CATGTTTAGG ATTGGCTGCT TTTTCAACAA TTTCGTCCAT TTGATTCCAA GCGCCACAAT 6780 

~ TAGGACATTT CCCCATCCAT TTAGGAGATT GATAACCACA AGCCATACAT TCAAAAATCA 6840 

~ CTTTTTTCTT GGC CAr AATT GCAcCTCCAC TTTCTT 6876 

30 

(2) INFORMATION FOR SEQ ID NO: 187: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1193 base pairs 
35 ^ (B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



40 ' (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 187: 

CAACTCAAAC AGCAGAACAA CGTCGTGAGT TGATTAATGG TGTATTTACT GACATTAATC 60 

CCATACATTA AAAATATGAT GTACGTGTTA GCAGATAATA GACATATCTC ATTAATAGCT 120 

45 GACGTATTCA AGGCGTTCCA AAGCTTATAT AACGGACACT ACAATCAAGA TTTTGCAACA 180 

ATTGAGTCAA CATATGAATT GAGTCAAGAA GAGTTAGATA AGATTGTCAA ACTAGTAACT 240 

CAACAAACGA AGTTATCTAA AGTTATTGTA GATACAAAAA TTAATCCAGA TTTAATTGGT 3 00 

50 

GGATTTAGAG TTAAAGTCGG CACAACTGTA TTAGATGGTA GTGTTAGAAA TGATCTTGTC 360 

CAATTACAAA GAAAATTTAG AAGAGTTAAT TAATTATAAA GAGGAGTGAC ATAGATGGCC 420 
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75 



20 



25 



ATGTCCGTAA CTGATGTAGG TACTGTATTA CAAATTGGTG ATGGTATTGC ATTAATTCAC 54 0 

5 GGATTAAATG ACGTTATGGC TGGTGAGCTA GTAGAATTCC ATAACGGCGT ACTTGGTTTA 600 

GCCCAAAACC TTGAAGAGTC AAACGTGGGT GTGGTTATTT TAGGACCATA CACAGGTATT 660 

ACTGAAGGTG ACG AAGTTAA AGGTACTGGT CGTATCATGG AAGTACCAGT AGGTGAAGAA 720 

W CTAATCGGAA GAGTTGTTAA TCCATTAGGA CAACCTATTG ATGGAcAAGG ACCGATTAAC 780 

ACAACTAAAA CACGTCCaGT AGAGAAAAAA GCTACTGGTG TAATGGATCg TAAATCAGTA 840 

GATGAGCCAT TACAAACAGG TATCaAAGCA ATTGATGCTT TAGTACCAAT TGGTAGAGGT 900^ 

CAACGTGAGT TAATCATCGG TGACOGTCAA ACAGGTAAAA CAACAATTGC AATTGACACA 960 

ATTTTGAACC AAAAAGATCA AGGTACGATT TGTATCTATG TTGCTATTGG TCAAAAAGAT 1020 

TCAACAGTAA GAGCAAATGT TGAAAAGTTA AGACAAGCAG GCGCTTTAGA CTACACTATT 1080 

GTTGTAGCAG CATCAGCTTC TGAACCTTCT CCATTATTAT ATATTGCACC ATATTCAGGT 1140 
GTAACAATGG GTGAAGAATT CATGTTTAAC GGTAAACATG TTTTAATCGT TTA 
(2) INFORMATION FOR SEQ ID NO: 188: 



40 



45 



1193 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5549 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
30 <D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 188: 
35 TGCTAAGAAG TCAAAATAAA CTAACTATnA AACATCTAGT ACGATTATTA AAGTGACAGA 

TnATAAAATT GAATTATTnA GAGAAGGAGA TATAAAGTTT GAAGAAATAA AAGAAAGACT 
AGGTACAGGT ATTATTTATG AATAAGTTAA TACTTGGGAT TTATTTATAC CGAATTTTTT 
CACGAGCATA CTTTTATTTA CCGTTTTTAT TAATTTACTT TTTGATTCAA GGTTATTCCA 
TAATACAATT AGAAATATTA ATGGCGTCTT ATGGCATTGC AGCATTTTTA TTCTCTCTAT 
ACAAAGAGAA GTGTTTTAAA ATTTGTAACT TAAAAGATTC TAATAAATTA GTTGTTAGTG 360 
AAATATTCAA AATCATCGGT TTATTGTTGT TATTATATCA AAATCAATAT TTAATTTTAG 
TAGTGGCACA AAT ATT ATTA GGGTTAAGTT ACTCAATGAT GGCGGGTGTT GATACCGCAA 
so '. TAATTAAAAG AAATATAACA AATGAGAAAT ACGTACAAAA TAAGTCAAAT AGCTATATGT 54 0 

TCCTATCATT ATTAATTTCA GGGATTATAG GTAGTTATCT TTATGGAATA AATATTAAAT 600 
GGCCTATAAT AATGACTGGT ATATTTTCAA TTCTAACAAT TATAATTATT CGATGCACAT 660 



60 
120 
180 
240 
300 



420 
480 
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TACCAGAAGA 


GAAfiTTTTGG 

XJ.*-M~fc\J X X X X VJNJ 


ATATTGCATT 


ATTCTTTTTT 


AAGAGCGTTA 


ATATTAGGAT 


780 




TTTTTATA(5G 

X X X X * ^» x /luw 


r% XXX f% X X Wj» m a 


ATTAATATAT 


ATAATGATTT 


AAAACTGAAT 


AATTTACAAT 


840 


5 


TT ATTTf'AGT 
X X x x x v«-nw x 


ATTAAC*TTGT 

■f^ x X f^r^ \_ X x VJ a. 


TACACAGTTA 


TGGGTTTTGT 


ATCTTCACGT 


TATTTAACTA 


900 




AATACTTGAA 


TTATAAGTTT 

X X X XXX 


GTGTCAGAAA 


TTTGTTTAGT 


AATATTTTTA 


ATAATATATA 


960 


10 


CATATCAAAG 


TTTCATAGCA 

XXX X JTWwl 


GTTACTATTT 


CT ATGAT ATT 


TTTAGGTATT 


TCTTCAGGGT 


1020 






APAAAPTATA 


AATAAACTTT 


CTAGCAGTAG 


TAACTTAAGA 


GTGATGCTTA 


1080 




ATTATGT'ArtA 


A A PGTT AT AT 

nnVJyJ X X *^ X r\ X 


X X J- 4a X X X X xx% 


ATATCGCATT 


TTTACTTATG 


GGTGGTTACT 


1140 


15 


tatatapa it 


Af2fl A A rTATT 
nuuiirU* X A X x 


r*AATAPTTAA 


TATTATTTAT 


TTCGTTATTA 


ATTTTTATAT 


1200 




Al X InAiAftl 


A hTMTTi/AT 


TTTAPAAflflA 


GAG AG CAACA 


TGAAAATAAA 


AACTGAATTT 


1260 




R » A/W*A »/"•» 


AlAintUilA 


TY2AATArnfA 


GCAGGTGCAG 


ATGTGAGTGA 


TTCTATTAAC 


1320 


20 


GGuAATCCAA 


TTAAGTCATT 


1 l»W*X X X\*rU* 


f*T A ATTG AAT 

UiAAl X uJW X 


TACCGGAAGG 


gACTAAATAT 


1380 




CTTGCTTGGT 


CTTTAATTGA 


r*T ATf2 ATOO A 




GTGGCTTTGC 


TTGGATTCAT 


1440 




TGGAGTGTAC* 


/•IT ft ^R^^^P & & 

C IAA1\? InAu 


XlaX IrvjXvjVaV. 


A ATTPAA'i'rr 


CTATAAAAGC 


AGATTTATCA 


1500 


25 


AGAACAAAGu 


ULAjAl* I A1\J 1 


A r* A A fTZTIT A A A 


A ATAflPTTTA 


CTAGTGGGTT 

W X T^VJ X WM\J X X 


GTTGGCTGAA 


1560 






AAAlAuAAAA 




GGACCTACAC 


CAGCTGATCA 


AGATCATCAA 


1620 


30 


lAlvjAAi IAA 


LAul X lAlvit 


flTTAftATPAT 
17 X livjn X x 


TPTTTAAATT 

X V» X X X^V^^^X X 


TGAAGAATGG 


GTTCTACTTG 


1680 


AATGAAXTXT 


TAAA AfiAAfiT 


AAATfTAAGAT 


AAAATTGATC 


AAACAAGTAT 


TAACCTTATA 


1740 




VjuAAvjAAAAA 




AATATPTrAT 
Xn X x \^r\ x 


CAAT AT AAAA 


TTGTTCAATT 


AAAAGTACAA 


1800 


35 


An & a AT* A A AfZ 


Vjl X X XnMX X x 


ATATATTAGG 

X X *» X X *WJw 


TACGGCGTTC 


GCTATAATGC 


AAAGAAGTAA 


1860 




^P^P A A A*P*T*TP A A 
X XnnnX x xnn 


RAAATGTAAA 


rTrTAGTTATT 

WX XJ^WX xnx i 


GTAATGTGAA 


TTTATTTGAA 


AAAATAGAAA 


1920 




GT ATT A A A A 

X.M X -X /vlwu\ 


TTATAGfTTT 

X X X /\V7\r XXX 


TACATTAATT 


AAAATTTATT 


TTTAAAAACA 


AGTAAACAAT 


1980 


40 


TT A P AT A PTT 


ATAATTTTTG 


AAAATTTTCA 


ATTTGTGTTA 


TATTGATTTT 


GTAAGATACT 


2040 




TTAACTCACA 


AAGGAGAGAG 


AGTATATGAA 


ATTAAAATCA 


TTTATAACTG 


TAACTTTGGC 


2100 




AGTGGGCATG 


ATCGCAACGA 


CTGGCGCTAC 


TGTGGCAGGT 


AATGAGGTAT 


CTGCAGCAGA 


2160 


45 


AAAGGACAAA 


CTACOGGCAA 


CTCAAAAAGC 


TAAAGAAATG 


CAAAATGTTC 


CATATACAAT 






TGCAGTAGAT 


GGCATTATGG 


CTTTCAATCA 


ATCTTACTTA 


AATTTACCAA 


AAGATAGCCA 


2280 


50 


ATTATCATAT 


TTAGATTTAG 


GAAATAAAGT 


TAAAGGTTTG 


TTATATGATG 


AACGCGGTGT 


2340 


AACACCTGAG 


AAGATTCGAA 


ATGCAAAATC 


TGCCGTTTAC 


ACGATTACTT 


GGAAAGATGG 


2400 




TAGTAAAAAA 


GAAGTGGATC 


TTAAGAAAGA 


TAGCTAGACA GCAAACTTGT 


TTGATTCAAA 


2460 
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CAACATGAAG CATTTAATTT TACAGTGATG ATTATAAAAT AATTGCCTTG ATACAAAGAT 
TACTCGTAAA TGACATCTTT GTATTAAGGC TTTTTCTAAA TTTAAAAGTG ATGGGTTAGA 

5 

GGTCATTGAG CTTTAAAATA TTCAAAATAC AAAACATTAA TGGCCAAAAA TAAAAGCCGC 
CTTTATCTGG GCAGCTTCAA TAATAAGAAA GACATATTTC ATTTTATACT AAATAGTTAT. 
ig TGTGATGAAT CTTTCGGCGG TTTAATTACT GCAGCAAAAA TTGCTGTGAA AATCGTGAAC 

AATACTGCCA TGATAATTGG ATTCACTACA TTTAAGCTGT CTCCACCTAC TAGGCTATTA 

AGTACAAAGT TAACGATTTG CATTAATAAT AATGCCCAAA AGAATGTTAC GAGGTGTTTC 
r5 ATGTCATTCT ACCTCCACTT TAATTATATA TATTTTATTT TAAGTGAAAG TTAGAAATTT 

GTATAGTAAC ATCTCATATA TTTTGACCAT ATTATACAGT TTAAATAAAT GATTTTATCT 
GAATGGCTAT TCTAAATTAA GCGCATTAAA ACCAATTTCA TACTGAAATT TGACGATAAT 
AAAGCATTAA AATTTTATTA ACTAGTCAAT ATTCCTACCT CTGACTTGAG TTTAAAAAGT 
AATCTATGTT AAATTAATAC CTGGTATTAA AAATTTTATT AAGAAGGTGT TCAACTATGA 
ACGTGGGTAT TAAAGGTTTT GGTGCATATG CGCCAGAAAA GATTATTGAC AATGCCTATT 
TTGAGCAATT TTTAGATACA TCTGATGAAT GGATTTCTAA GATGACTGGA ATTAAAGAAA 
GACATTGGGC AGATGATGAT CAAGATACTT CAGATTTAGC ATATGAAGCA AGTTTAAAAG 
^ CAATCGCTGA CGCTGGTATT CAGCCCGAAG ATATAGATAT GATAATTGTT GCCACAGCAa 

CTGGaGATAT GCCATTTCCA ACTGTCGCAA ATATGTTGCA AGAACGTTTA GGGACGGGCA 
AAGTTGCCTC TATGG ATCAA CTTGCAGCAT GTTCTGGATT TATGTATTCA ATGATTACAG 
35 CTAAACAATA TGTTCAATCT GGAGATTATC ATAACATTTT AGTTGTCGGT GCAGATAAAT 

TATCTAAAAT AACAGATTTA ACTGACCGTT CTACTGCAGT TCTATTTGGA GATGGTGCAG 
GTGCGGTTAT CATCGGTGAA GTTTCAGATG GCAGAGGTAT TATAAGTTAT GAAATGGGTT 
CTGATGGCAC AGGTGGTAAA CATTTATATT TAGATAAAGA . TACTGGTAAA CTGAAAATGA 
ATGGTCGAGA AGTATTTAAA TTTGCTGTTA GAATTATGGG TGATGCATCA ACACGTGTAG 
TTGAAAAAGC GAATTTAACA TCAGATGATA TAGATTTATT TATTCCTCAT CAAGCTAATA 
TTAGAATTAT GGAATCAGCT AGAGAACGCT TAGGTATTTC AAAAGACAAA ATGAGTGTTT 
CTGTAAATAA ATATGGAAAT ACTTCAGCTG CGTCAATACC TTTAAGTATC GATCAAGAAT 
TAAAAAATGG TAAAATCAAA GATGATGATA CAATTGTTCT TGTCGGATTC GGTGGCGGCC 
TAACTTGGGG CGCAATGACA ATAAAATGGG GAAAATAGGA GGATAACGAA TGAGTCAAAA 
TAAAAGAGTA GTTATTACAG GTATGGGAGC CCTTTCTCCA ATCGGTAATG ATGTCAAAAC 
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25 



X unni.k> i inl 




TAGGAGGAGA 




TTTAATATTG 


AAGATCATAT 


43 80 


UunLnnnnnn 


GAAGPGGGTC 


GTATGGATAG 


ATTTACTCAA 


TATGCAATTG 


TAGCAGCTAG 


4440 




AAAGATGCGC 


AATTAGATAT 


CAATGAAAAT 


ACTGCAGATC 


GAATCGGTGT 


4500 


a TflfZ 21 TTrl/lT 
aXvtVjAX 1 VJV 1 


1L1 \3\J X £\ X V— »J 


GTGGT ATGGA 


AAPATTTGAA 


ATTGCACATA AACAATTAAT 


4560 


2t T 21 A 21 flflC 


r* r* zi 2i rz 21 ogty* 




TTTr , GTAC'*(^A 


ATGTTAATTC 


CTGATATGGC 


4620 




GT ATf"* A ATTTG 


AfTTAGGTGf* 


AAAAfiflAfPA 


AATGGTGCAA 


CAGTTACAGC 


4680 




uuliiL/vinl X 


fAATW^IGAfSA 


AnrATTTA A A 


ATTGTGCAAC 


GCGGTGATGC 


4740 


AGATGCAATG 


ATTACTGGTG 






CATATGGCAA 


TTGCTGGTTT 




/•» TV /"'TV 1 /*"* TV TV /'i»p 


CGAGCGCTTT 


rf'Tft f^ft ft H'lV^TA 


*IY* A f* A 21 A 


ACAGCATGTC 


GTCCATTCCA 


*±oo\j 


AGAAGGTAGA 


GATGGTTTTG 






ATTTTAGTAA 


TTGAATCTTT 




AGAATCAGCA 


GAAGCTCGAG 


GTGCGAATAT 


II A X\iL. I vjAL» 


ATAGTTGGCT 


ATGGTACTAC 




AGGTGATGCT 


TATCATATTA 


CAGvJG C CAGC 




GAAGGTGGTT 


CTAGAGCAAT 


• c a a n 


GCAAGCAGCT 


ATGGATGATG 


CTGGTA II XjA 


ji f*f »« 1 'ft ft ft ft T 

Av- v* 1 AAAuA X 


GTACAATACT 


TAAATGCCCA 


31UU 


TGGTACAAGT 


ACTCCTGTTG 


/ iiiii i « / uiuiiyi ft ft 

GTGACTTAAA 


TGAAGTTAAA 


GCTATTAAAA 


ATACATTTGG 


DlOU 


TGAAGCAGCT 


AAACACTTAA 


AAGTTAGCTC 


ft ft /"»ft ft. TV ft Trft 

AALAAAM.1 L-H. 


ATGACTGGTC 


ACTTACTTGG 




TGCAACAGGT 


WiftAl lbAAb 


LAftl L. I ILiL 


1X1 


ATTAAAGACT 


CTAAAGTCGC 




ACCGACAATT 


CATGCGGTAA 


CACCAGATCC 


AGAATGTGAT 


TTGGATATTG 


TTCCAAATGA 


534 0 


AGCGCAAGAC 


CTTGATATTA 


CTTATGCAAT 


GAGTAATAGC 


TTAGGATTCG 


GTGGACATAA 


5400 


CGCAGTATTA 


GTATTCAAGA 


AATTTGAAGC 


ATAACTATAA 


nAATCTTCAG 


TAACGTTGTT 


5460 


TTAGTTACTG 


AAGATTTTTT 


CaGTTTCTTT 


ATACTAAGAT 


GAGCGACAcA 


CAATCGTCAT 


5520 


AATAAAATAT 


GAATATTTAT 


TAATAATAA 








5549 



40 (2) INFORMATION FOR SEQ ID NO: 189: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 4832 base pairs 

(B) TYPE: nucleic acid 

45 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 189: 

50 

AGATTATAGT AAGATTGATA GTTTGGCGAC TGaAGCgCGa GaAAAATTAT CAGaAGTAAA 60 
mCCTTTAAAT ATTGCACAAG CTTCTAGAAT ATCAGGGGTA AATCCAGCAG ACATATCTAT 120 
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TGGTTAGCAG AACAATTAAA AGAACATAAT ATTCAATTAA CTGAGACTCA AAAACAACAG 
TTTCAAACAT ATTATCGTTT ACTTGTTGAA TGGAATGAAA AGATGAATTT GACAAGTATT 
ACAGATGAAC ACGATGTATA TTTGAAACAT TTTTATGATT CCATTGCACC TAGTTTTTAT 
TTTGATTTTA ATCAGCCTAT AAGTATATGT GATGTAGGCG CTGGAGCTGG TTTTCCAAGT 
ATTCCGTTAA AAATAATGTT TCCGCAGTTA AAAGTGACGA TTGTTGATTC ATTAAATAAG 



240 
300 
360 
420 



540 
600 



CGTATTCAAT TTTTAAACCA TTTAGCGTCA GAATTACAAT TACAGGATGT CAGCTTTATA 
CACGATAGAG CAGAAACATT TGGTAAGGGT GTCTACAGGG AGTCTTATGA TGTTGTTACT 
GCAAGAGCAg TAGCTAGATT ATCCGTGTTA AGTGAATTGT GTTTACCGCT AGTTAAAAAA 660 
GGTGGACAGT TTGTTGCATT AAAATCTTCA AAAGGTGAAG AAGAATTAGA AGAAGCAAAA 
TTTGCAATTA GTGTGTTAGG TGGTAATGTT ACAGAAACAC ATACCTTTGA ATTGCCAGAA 
GATGCTGGAG AGCGCCAGAT GTTCATTATT GATAAAAAAA GACAGACGCC GAAAAAGTAT 
CCAAGAAAAC CAGGGACGCC TAATAAGACT CCTTTACTTG AAAAATAATG CATAATCCTT 
TACAACTAAC ATAAAAGGAG CGAATGGATA ATGAAAAAAC CTTTTTCAAA ATTATTTGGT 
TTGAAAAACA AAGATGACAT CATTGGACAT ATTGAAGAAG ATCGCAATAG TAATGTTGAA 
TCCATTCAAA TTGAACGTAT CGTTCCCAAC CGTTATCAAC CAAGACAGGT GTTTGAACCA 
30 AATAAAATTA AAGAACTTGC TGAATCAATA CATGAACATG GTTTACTACA ACCTATTGTT 

GTAAGACCGA TTGAAGAAGA TATGTTTGAA ATTATTGCTG GAGAGCGCCG ATT TAG AG CA 
ATACAATCAC TAAATTTACC TCAAGCAGAC GTTATTATTC GTGATATGGA TGATGAAGAG 
35 ACGGCTGTTG TTGCATTAAT TGAGAATATT CAAAGAGAAA ATTTGTCTGT TGTTGAAGAA 

GCGGAAGCCT ATAAGAAATT ATTGGAAATT GGTGATACAA CGCAAAGTGA ATTGGCAAAA 
AGTTTAGGTA AAAGTCAAAG CTTTATTGCA AATAAGTTGC GTTTATTGAA GTTCGCGCCG 
AAAGTACTAC TTCGCTTAAG AGAAGGTAAA ATTACTGAAC GTCATGCGAG AgcGGtATTA 
TCATTGTCTG ATAGCGAACA AGAAGCGTTG ATTGAGCAAG TCATTGCACA AAAGCTAAAT 
GTGAAcAGAc TGAAGATAGA GTACGCCAAA AAACGGGGCC CGAAAAAGTC AAAGCACAAA 
ACCTTCGCTT TGCACAAG AT GTCACTCAAG CACGAGATGA GGTAGGCAAA AGTATCCAAG 
CGATTCAACA AACAGGATTA CATGTTGAGC ATAAAGACAA AGATCATGAA GATTATTATG 
SQ AAATAAAAAT TCGAATATAT AAACGTTaGT AGTAGGATGT CGTATACATG ATGACTAACA 

CATAAAAGAC AAAGCTAAGA TCATAACAGC TTTGTCTTTT TTTTTTGTTT TACGTGAAAC 
ATAAAAATTT ATATTTATAT GTTGATCAGG CTGGTACATA AATCAATGTT CTATGCTCTA 



720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
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10 



15 



20 



25 



30 



35 



40 



. 45 



SO 



TTCTAGTCAA 


CCTTGCTGGG 


GTGGGACGAC 


GAAATAAATT 


TTGCGAAAAT 


ATCATTTCTG 


2040 


TCCCACTCCC 


TAATTTGAGC 


TGGATATACT 


TTCATTTGAA 


CCCTTTATTG 


CTAGTTTATG 


2100 


AAAGTATCAT 


GAAAGCTTTA 


TGAACATCGC 


TTGAGTTGCC 


TTTACAGTAG 


AAAATTTAAG 


2160 


TTTTACACTT 


TGTGTGAATG 


ATACGTTTTG 


TATTGAATTA 


ATTATAGAAA 


GGTACGTTGA 


2220 


AGATGTTTTC 


AATTGGAAGT 


GCAATTCTTC 


ATTTTGT CAT 


TGGTGGTATC 


GCTGTTGCAT 


2280 


TAG CTTCAAT 


TATTGCTGAT 


AAGGTAGGTG 


GTAAGTTAGG 


AGGTATTATA 


GCTACTATGC 


2340 


CGGCAGTCTT 


TCTTGCGGCT 


ATTATCGCAT 


TAG CTTTAGA 


TCATCGTGGT 


ACGCAATTAG 


2400 


TGGAGATGTC 


GATGAATCTT 


AGTACTGGAG 


CAATTGTCGG 


TATTCTGTCT 


TGTATATTAA 


2460 


CTGTATTTTT 


GACAT CTCTC 


TACATTAAGC 


ATAAAGGTTA 


TCGGAAAGGC 


GCAATATTCA 


2520 


CAGTTGTTTG 


TTGGTTTGTC 


ATTTCCCTCG 


CAATATTCAG 


TATTAGACAT 


TTATAGTTTG 


2580 


GAAAATGCGT 


GATAATTAGT 


TGTATT CAGT 


TATTAAGTAA 


TAAATTATTG 


GAGGCAGAAC 


2640 


ATCATGAAAT 


TAACATTAAT 


GAAATTTTTT 


GTGGGGGGAT 


TTG CAGT ATT 


ATTAAGTTAT 


2700 


ATTGT AT CTG 


TAACACTACC 


TTGGAAAGAA 


TTTGGCGGTA 


TATTTGCaAC 


GTTTCCGGGA 


2760 


GTATTTTTAG 


TGTCTATGTT 


TATTACAGGT 


ATGCAATATG 


GTGATAAAGT 


CGCTGTGCAT 


2820 


GTAAGTCGTG 


GCGCAGTGTT 


TGGTATGACA 


GGGGTATTAG 


TTTGTATTTT 


AGTTACATGG 


2380 


ATGATGTTAC 


ATATGAGGCA 


CATGTGGTTG 


ATT AG CATTG 


TTGTTGGTTT 


CCTAAGCTGG 


2940 


TTCATCAGTG 


CAGTATGTAT 


TTTTGAAGCG 


GTAGAATTTA 


TAGCACAAAA 


AAGATTAGAA 


3000 


AAGCATAGTT 


GGAAAGCTGG 


AAAATCGAAT 


AGTAAATAGT 


GTGAACGTAA 


T CTCTTAACT 


3060 


AGGACTAACT 


TTGCAAGCAT 


TGAATAGGAT 


GGAAAAGTTG 


CATCATTAAT 


AAGTGAAATT 


3120 


CAAGTTGGCA 


TTGAGAAAAT 


TACAAGCGCG 


TAATCATAGa 


GGTCTGTCTT 


AAGGGAGTCT 


3180 


TCG^CCCCG ATGTTGTCGT 


ATGTCAAAAC 


ATTTAGTCAA 


TCATAAAGGT 


GACTTGATTT 


3240 


AACTTTATCT 


GATAGTCTGA 


TTGTAATGAT 


TGTACTAATT 


GACTGGAGGC 


GTATGTAATT 


3300 


GAATCTGAGT 


AAACAAATTA 


AAAAGTATAG GGAACGAGAT GGTTATTCAC 


AAGAATATCT 


3360 


TGCTGAAAAG 


TTATATGTAT 


CTAGGCAGAG 


TATTTCTAAT 


TGGGAAAATG 


ACAAAAGCTT 


3420 


ACCAGACATA 


CATAACTTAT 


TAATGAyGTG 


TGAATTGTTC 


AATGTAACTT 


TAGATGATTT 


3480 


AGTAAAAGGG 


ACCATTCCAt 


TTGTACCTGA 


TATTAAAGCG 


CAACGAAGTC 


TTAACTTATG 


3540 


GACAT ATGTG ATGCTTATTT 


TCATGACATT 


AGCTGCAATT 


TTAATGGGAC 


CTTTAGTTGT 


3600 


TTATTGGAAT 


TGGACTTGGG 


GTGTAACGGT 


GGCAATCATT 


TTGGGAATAG 


GTTTTTATGC 


3660 


ATCTATGAAA 


ATAGAAGATT 


TAAAAAAAGT 


GCATAAAATG 


GACAACTACG 


ATCGAATTGT 


3720 
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GACAAATGCG CTTTCTATTA TATCAGTAAT TGGTATACTC AGCCTCATAA TTTTCCTTAG 3840 

TGTGTATTTG GCAAATAAGT TTTTATAAAT CATCGTGGTA TCGTCTCATA TTATTTATAT 3 900 

TATCCAAAAT AGCATAAAAA AATACCAACA AGATTTAGAA CCTTGTTGGT AATCAAAGCG 3960 

- aTTCATTTAT AATGAGTCGT TTTATGTTGT AAGATTAAAC AGTTTGTACG TTAACTGCTT 4020 

10 GGTCTCCACG TTGACCTTCA GTGATTTCGA AAGTAACTTT TTGACCTTCT TCTAAAGTTT 4080 

TGTAGCCATC GCTAGCGATA CCTGAGAAAT GTACGAATAC GTCTCCGCCA TTTTCTTGTT 4140 

CGATGAAACC AAAACCTTTT TCTGCrTTAA ACCATTTwAC TGTACCGTTA TTCATATwGA 4200 

rS AwACCTCCGT gTGCTTTTGC ACTTAATATT TGTAACAAAT TCATAACTAA AAAAGAGGAT 4260 

ATTCTAAACA AATACACTAC AATTTAATTC ACGAGCTTTT ATTACGTAAG ACCAACTATA 4320 

CGCTCATATT GGCATAATGT ACAGTGTTTT TTGAAAATAA ATTAAAAAAG ATTTTTAAAA 4380 

ACCTTAGAAA CGTTGATTTA AAGGGGTTTA TAAAAATwAw AAAATTGTAG TCTTTTATGG 4440 

TGTTTG CTAG TTTTCAAAGT GACATATCGT TTAAACATGA TGATTTTATA AGGAATCCAT 4500 

AAAAAACAAG CAGCGATAAA CGCTACTTGT TGATATTAAA ATCTGACTTG AAAGGTCATA 4560 

GCAATGTTCT ATACCGATGG AATGTGCTTA CTTGCCTTTT TCTTCACGAC GTTTTAAATA 4620 

ATAAGAGCCA CCTAATAAAC CAGCTGGAAT GCCTATCATT GGTGTTGTGA ATGAGCTTAA 4680 

TACAATAACA AGTATTGTTA AAGCAATGAC GTTATACCAA GTTACAGTCA AATTTTTCAA -4740 

ATCCTCATAT GATTGTTTTA CTAATTCTCT AAATTTCATG ATTCAATCTC TCCTTTTTTA 4 800 

TAAATCTTTA GATTGTCAAA TTAAGCTGGA CA 4832 

35 (2) INFORMATION FOR SEQ ID NO: 190: 

(i) SEQUENCE CHARACTERISTICS: " 
(A) length: 5727 base pairs • 
- (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
40 (D) TOPOLOGY: linear 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 190: 
CAAAGCTGTT CAAAAGGCTT ATAATTTAAA TTTAGATAAC ATACGTACAA TGGAACCTAA 

GTTGAGATAT CAAGCGATCA ATAAAGGTAA TATTAATTTA ATAGATGCAT ATTCAACTGA 120 

CGCTGAATTA AAACAATATG ATATGGTTGT GTTAAAAGAT GATAAGCACG TATTTCCACC 180 

ATATCAAGGA GCACCATTAT TTAAAGAAAG CTTTTTAAAG AAACATCCAG AAATTAAGAA 240 

ACCGTTAAAC AAACTAGAAA ACAAAATATC TGATGAAGAT ATGCAAATGA TGAACTATAA 300 
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10 



15 



GTTAATCAAA TAACGACCAA CGCCACATAA GATGCGTAAC ACCAAATTAT ATCTTATGTG 4 20 

GCGTTGTTAT ATTTAAATCT ATAATTATGT TCAATTTAAA CATGCAATAA TGATTAAAAA 4 80 

ATATGACATG TTAAACACAA TGTAAGCTAT TATGATGTGA AAATAGTAGC ATTGCATTTT 54 0 

AGAAACATAG AGCGATATAA TGAATATAAG TTTTTTGAAA TTTCAGTTAA TTCTAAGGAG 600 

GTTGTTTTTA TTATGAAAGA ACAACTTAAT CAACTATCAG CATATCAGCC TGGTTTATCT 66 0 

CGAAGGgCAT TGAAAGAAAA GTATGGCATT GAAGGAGATT TATATAAACT TGCATCAAAT 720 

GAAAATTTGT ATGGACCATC GCCTAAAGTT AAAGAAGCGA TATCAGCACA CTTAGATGAG 780 

TTATATTATT ATCCTGAAAC AGGATCACCG ACATTAAAAG CGGCGATTAG TAAACATTTA 84 0 

AATGTAGATC AATCACGCAT TTTATTTGGT GCGGGATTAG ATGAAGTTAT ATTAATGATT . 900 

TCTAGAGCTG TATTAACGCC AGGGGATACT ATTGTTACAA GTGAAGCGAC ATTCGGTCAA 960 

20 TATTATCACA ATGCGATTGT TGAATCAGCT AATGTGATAC AAGTACCTTT AAAAGATGGT 1020 

GGCTTCGATT TAGAAGGTAT TTTAAAAGAA GTTAATGAAG ATACGTCATT GGTATGGTTA 1080 

TGTAATCCAA ATAATCCTAC AGGTACATAT TTTAATCATG AGAGCTTAGA TTCGTTTTTA 1140 
25 TCTCAAGTAC CTCCACATGT ACCAGTAATT ATAGATGAAG CTTATTTTGA ATTTGTGACA - 12 00 

GCAGAGGACT ACCCGGATAC ACTTGCTTTG CAACAAAAAT ATGACAATGC TTTCTTATTA 1260 

CGTACATTTT CAAAGGCGTA TGGATTAGCG GGTTTACGTG TAGGATATGT GGTAGCAAGT 1320 

GAACATGCGA TTGAAAAATG GAACATCATT AGACCACCAT TTAATGTGAC ACGTATATCT 13 80 

GAATACGCAG CAGTTGCAGC ACTTGAAGAT CAACAATATT TAAAAGAGGT AACACATAAA 1440 

AATAGTGTTG AACGCGAAAG ATTTTATCAA TTACCTCAAA GTGAGTATTT CTTGCCAAGT 15 00 

CAAACGAATT TTATATTTGT AAAAACmAAG CGGGTAAATG AACTTTATGA AGCACTTTTA 1560 

AATGTAGGGT GTATTACGCG ACCATTTCCA ACTGGTGTTA GAATTACAAT TGGTTTTAAA 1620 

GAACAAAATG ATAAAATGTT AGAAGTTTTA TCAAACTTTA AATACGAATA GTAAGTGGGG 1680 

AGTGGGACAG AAATGATATT TTCGCAAAAT TTATTTCGtC GTCCCACCCC AACTTGcATT 174 0 

GTCTGTAGAA ATTGGGAATC CAATTTCtCT, TTGTTGGGGC CCCGCCGGCA AGGTTGACTA 1800 

45 GAATTGAAAA AAGCTTGTTA CAAGCGCATT TTCGTTCAGT CAACTACTGC CAATATAACT 186 0 

TTGTAGAGCA TTG AACATTG ATTTATGTCT CAAGCTCAAT GCAGTGTGAA TGATGAGGTG 1920 

AGAGTATTCA GTGTAAAAAG CAACAATAGA TGATATTGTT TTGTATCAAT TGCTTTTTTG 1980 

50 CTATACTGAA TCAATACTGA TATTTTCAGG AGAAGATTAA AATGACCCGT AAATCAATCG 2040 

CGATTGATAT GGATGAAGTA TTGGCAGATA CATTAGGAGA AATCATTGAT GCTGTCAATT 2100 
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TTCCTGAACA TGATGGATTA ATTACAGAAG 
TTAAAGTGAT GCCGTATGCA CAAGAAGTTG 
ATATTGCTAC AGCAGCAATG GATGTACCAA 
TAGAGTTCTT TCCATTTTTA GATCCTCAGC 
TTAAAGCTGA TTATTTAATA GATGACAATC 
CGATTATGTT TACAGCAGTG CATAATATTA 
GGAAAGATGT AGAACAGTAT TTTTTAGATA 
AATTTCATGT AGAAAAGATG ATGGATAGGC 
TATGTCTTAG ACACTACAAC ACTATATTGG 
GAAATTGGAT TCCCAATTTC TACAGACAAT 
ATACTTTTTC TTTAGAAATT AGTATTTCTT 
TTTAAGTACA CATTAGCTGT G ACT AATGAT 
GTTCTTTATC ATTTCCGTCC CGCTCTCAAT 
GGATGAATGT GTTAATCTAT GGCAGATTAC 
AAGACG CAT A AACCACTATG ATTTAAAATA 
. AAATT ATATG TCTGTTTTTG AAACAGGGTA 
GGTGCGTTGA ATCTTATGAT TACACTCCAA 
CGGATGCTTA CAAATCATTG ACAGTAAGTA 
CAATAGGTGT TTCTAATGAA ATTTCGCCAT 
TAAGTGAAAT CTTTTTACCA GGTAT ATGCT 
TGCTATCACG CTTTTTAAAA ATATCATTTA 
AAGTGTTCAG TTCACCATCT TGAGGAGACA 
TGAATGGACC ATTTGCTGTT AGTATCATGG 
TTGATAATTG ATAATTAAAT TGTGTTGGAT 
AACTCAATTT ACCAAATATA TCTTTTGAAC 
TGAGACCTAA GCCAACAAAG TTGAGTGCAT 
TACCAACTTG TGCAGAAATC ATTTGTTCAC 
GCGTTTTTGT AAAATCATTA AAAGTACCGC 
CATGTGTCAT AACACCGTTT ATAAGTTCGT 



TATTGAGAGA 
TGAAAAAATT 
CATCATTTAG 
ATTTTGTTTT 
CTAGACAGCT 
ATGATGATCG 
ATATTGAGAA 
TATAAAGTAA 
CAGTAGTTGA 
GCAAGTTGGG 
ATGCATGAGT 
AAAGAATCGC 
AAATGTTAGT 
ACGTCATCCG 
CAACATCAAT 
ATAGCTTAAA 
ACCTAATATA' 
ACTGAATGGO 
CAATATCAAC: 
CAATACCTTG 
AAATACTGAA 
AATCAGTCaA 
TCGTTTCGCC 
TTAGCAGTGT 
CATCTTGTAC 
ATTGATTATT 
TAGCTTGTTT 
CTGGTAAAAT 
TAACCGTGCC 



ACCAGGCTTC 
AACTGAACAT 
TGATAAATAT 
TTGTGGTAGA 
TGAAATTTTT 
ATTTGAACGC 
ATAAAATATA 
TTGTGACTGA 
CTGCGGGGCC 
GTGGsCCCCA 
GTAACTCATG 
TACATAATCA 
CTATCTTATT 
ATTTTTTATA 
CATTTTAGTG 
GCTAATAAAA 
ATATCGGGTT 
ATTTGGTATA 
TTTCATTGCT 
AGTAATTTCA 
ACTTTGTTCA 
TGGTATACGA 
AGAATATGTC 
TTTGACAGTT 
GTTTTCAGCG 
TATTTTAATT 
ATGATTAGGT 
GCCAATAGGG 
ATCACOGCCA 



TTCAGACATC 
TATGATGTAT 
GAATGGTTAC 
AAAAACATCG 
ACTGGTACAC 
GTAAATAGCT 
TCACTTGAAA 
GATGAACTTT 
CCAACATAGA 
ACATAAAGAA 
CATTCATATT 
ATCATTAGTC 
ATTATAAATC 
GAATTTGAAA 
gCATGCGCCA 
ACGAATATAA ' 
AAGATCATTC " 
AC CTCAATAT 
GGATCTGTTG 
TTCCaATTCA 
TTAAAAATGA 
CTACCACCAA 
TTATCATCTA . 
GATCCAATAT 
TTTTGAACAA 
ACATCGTATG 
GCTATATTTA 
AGTTGAAGGT 
AGAATAAATA 



2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

28B0 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

33i50 

3420 

3480 

3540 

3600 

3660 

3720 

3780 

3840 

3900 
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CACCTTCGTT 


TTCACTCAAT 


TGAATAGAAA 


w% X VJ\_> X X f\\*t\ 


nn* x \jn£V>* x X 








TAACTTCCCC 


AATACCTTGA 


TTAATATTTT 


TTAATCCACT 


GTGTTCATGG 


TAAAAGAGGA 




s 


CACCATGTGT 


ATATTTATTT 


TCCATAGTTT 


AGCCTACTTT 


CTAAAAATTG 


GTTCATTAAA 


414 0 




TATATATACC 


CACTTTTAAT 


TGTTAATACC 


AAAAATATGT 


TTTTAAATAG 


AGAAAATGGT 




10 


AATAAATGAA 


ATTGATTTCT 


ATAGAGTGGG 


ACGAGAAAAT 


ATAGTTATAG 


CTGTCTATAA 




TG AG CAT ATT 


AAGTTTTTAT 


TTATACTGAT 


ATCTTGAATT 


TAATTAATAG 


AAACCTATAA 






AAAAACAGTA 


AGCCATTTAA 


ATGACTTACT 


urrrrrrGAA 


TTAGGCCAAC 


AATATTAACG 




15 


TATACCTTTC ATCGCTTTGA TGATTAAAGG TGAGAATGCT AATACAATTG TTGTAACAAT 


444 0 




AATTGCAACA ACACCTAGGA 


AAATAAAGTA 


ATTTGTTTGA 


CCTAGTGGTT 


CTATTAACTT 


4500 




AACTAAAGTA 


CCATTGATTG 


CTTGTGCAiGA 


AGCGTTAGTT 


AAGTACCAAA 


TACTCATCAT 


4560 


20 


TTGGGCATTA 


AATGCTTTAG 


GTGCTAACTT 


AACAGCAGCA 


CTATTACCCG 


TTGGTGATAA 


4620 




GCATAGCTCA 


C CGATAACAC 


AAATAATGTA 


CGATAAAATA 


ACCCAGTTAA 


CTGAAAAGTT 


4680 




TGATGAACCT 


GATGCATAAC 


CTACAATACC 


AATTAGTATG 


TATGACGCAC 


CTGCTAAGAA 


4 74 0 


25 


CGTACCAATT 


GCAAATTTTA 


CTGGCAGGCT 


AGGTTGTTTA 


GTTCCAAGCT 


TTTGCCATAA 


4800 




AAGTGAAATA 


ATTGGAGCTA 


GTAATAAAAT 


AAATAATGGG 


TTAATTGATT 


GGAAGATCGC 


4 860 








AACGAAATAA 


GTTTAATTTC 


ATATCTGAAT 


GTTCAATTCC 


4920 


30 


ATATATGTTT 


AATACATTAG 


ACCCTTGTTC 


TTGAATAGCC 




1 iCCAAGAAT 


4980 




AAATAATGGA 


ATAAATGCTT 


TAACACGAGA 


ACGTTCAGTA 


TCAGTGACAT 


CTTTACTTCT 


5040 


35 


AAT AATT AAA 


GTGAAGTAAA 


TGAnTGGTAA 


TGCAATACCT 


AATACTAAAA 


CAGTATTACT 




AACTAAGTTA 


AATGATAATG 


AGTTAGTTAA TGCACCAATA 


ACGATAATTA 


ATACAATTGC 






TAAJtACAACA 


CTTCCGATAA 


TAAGACCATA 


CTTTTTCTTT 


TGAGCTGGTG 


TCAATGGGTT 




40 


AGTAGGTTTC 


ATACCAACGC 


TACCTAAGTT 


TTTGCGGTTG 


AAAAGTACAT 


ACCATACTAA 




ACCTAATGCC 


ATACCAACTG 


CTGCAATCAA 


GAATCCGCCG 


TGGAAGTTTT 


TAACATTAAC 






AAAGTGTTGC 


AAAATAATAG 


G TG AT AATAA 


TGCACCCATA 


TTAACTGACA 


TATAGAAAAT 




45 


AACAAAACCT 


GCATCCATAC 


GTCTATCATT 


TTCAGGATAT 


AAACGGCCAA 


CGATATTTGA 


5460 




AATGTTTGGC 


TTCATTAAAC 


CTGAACCAAT 


AATGATGAAG 


AACATTGATG 


TGAATAAGCC 


5520 




GATTAATGCA 


AATGGTAAGC 


TTAAACAAAT 


ATGTCCGATA 


ATAATAAAGA 


CTGCACCTAA 


5580 


50 


TAAAGTAGCG 


CCTCTAGTGC 


CTGTAATTCT 


GTCAGCAATC 


CATCCGCCTG 


GTATTGATGT 


5640 




CATATAGATT 


AATGAACCAT 


ArACTGACAT 


AATTGACATA 


GCTGTTGTTT 


TATCAATTCC 


S700 
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(2) INFORMATION FOR SEQ ID NO: 191 : . .. 

f (i) SEQUENCE CHARACTERISTICS: ■ 

(A) LENGTH: 14078 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 191: 
TGGACTATTA ACGGCGaAGA AGATTTAACG AAATACTTAC AAACCAATGT TGATGGTATT 60 
15 AT CACAGATG ACCCAGCATT AGCTGATCAG ATTAAAGAAG AAAAGAAAGA CGAAACATAC 120 

TTCGATCGTT CTATAAGAAT TTTGTTTGAA TAATATAAAC AAAGACCTCT AAAGTTATCA 180 
AGATGATACC TTCAGAGGTC TTTTTAATGT TGCCATCTAT GGGATAGGCA ATCGTTTCAT 240 
20 TCGTTTATAT TCATATGACA AGTATTTGTA TGGCAATTTG GCGTCACAAA CACTTACATG 300 

ATTTATTGGT GAATTATTAA TTGTTTTGTG AATGCAAAGG GTTAGAAATT GAATTGTAAA 360 
TACTTTCTAA TCTTTGTTTC GCTTTAGTCA TTTGATCCAA ATTTTTAGTG CGTATAGCGG 
ATTTTGCAAT ATAGTGCGCA CTAAAATATC GCGTTTTTGA AACGCATCTA AATTTAGGTA 
CGATAATTTA TTTAAGTCAG TGTTTGCTAT TAATTCATGT AATTGATCTA CAAGCGCTTG 
ATGTTGATAC GTATGTGATG TAGTTTCAGA TTTGCTTGCT AATTTAATAC CAGTCGTATC 
AAGGAGCGCC GCTTTAATAC CAGCAACTAA ATATGTTTTG ATTTTCATTT GTGTTGTCAT 
GCTTTGTTAC TCCTTTGATG TACATTAATC AAAAAAATTA TACACTATTG TATATTGCAA 
AGCTAATTAA CTATAACAAA AAGATAGTTA ATGCTTTGTT TATTCTAGTT AATATATAGT 
TAATGTCTTT TAATATTTTG TTTCTTTAAT GTAGATTGGG , CAATTACATT TTGGAGGAAT 
TAAAAAATTA TGAAAAAGCA AATAATTTCG CTAGGCGCAT TAGCAGTTGC ATCTAGCTTA 
40 TTTACATGGG ATAACAAAGC AGATGCGATA . GTAACAAAGG ATTATAGTGG GAAATCACAA 

GTTAATGCTG GGAGTAAAAA TGGGACATTA ATAGATAGCA GATATTTAAA TTCAGCTCTA 
TATTATTTGG AAGACTATAT AATTTATGCT • ATAGGATTAA CTAATAAATA TGAATATGGA 
45 GATAATATTT ATAAAGAAGC TAAAGATAGG TTGTTGGAAA AGGTATTAAG GGAAGATCAA 

TATCTTTTGG AGAGAAAGAA ATCTCAATAT GAAGATTATA AACAATGGTA TGCAAATTAT 
AAAAAAGAAA ATCCTCGTAC AGATTTAAAA ATGGCTAATT TTCATAAATA TAATTTAGAA 
GAACTTTCGA TGAAAGAATA CAATGAACTA CAGGATGCAT TAAAGAGAGC ACTGGATGAT 
TTTCACAGAG AAGTTAAAGA TATTAAGGAT AAGAATTCAG ACTTGAAAAC TTTTAATGCA 



420 
480 
540 
600 
660 
720 
780 
• 840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
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GTTGTATCAT 


ATTATGGTGA 


TAAGGATTAT 


GGGGAGCACG 


CGAAAGAGTT 


ACGAGCAAAA 


1500 




CTGGACTTAA 


TCCTTGGAGA 


TACAGACAAT 


CCACATAAAA 


TTACAAATGA 


ACGTATTAAA 


1560 


5 


AAAGAAATGA 


TTGATGACTT 


AAATTCAATT 


ATTGATGATT 


TCTTTATGGA 


AACTAAACAA 


1620 




AATAGACCGA AATCTATAAC 


GAAATATAAT 


CCTACAACAC 


ATAACTATAA 


AACAAATAGT 


1680 




GATAATAAAC 


CTAATTTTGA 


TAAATTAGTT 


GAAGAAACGA 


AAAAAGCAGT 


TAAAGAAGCA 


1740 


10 


GATGATTCTT 


GGAAAAAGAA 


AACTGTCAAA 


AAATACGGAG 


AAACTGAAAC 


AAAATCGCCA 


1800 




GTAGTAAAAG 


AAGAGAAGAA 


AGTTGAAGAA 


CCTCAAGCAC 


CTAAAGTTGA 


TAACCAACAA 


1860 


15 


GAGGTTAAAA 


CTACGGCTGG 


TAAAGCTGAA 


GAAACAACAC 


AACCAGTTGC 


ACAACCATTA 


1920 


GTTAAAATTC 


CACAGGGCAC 


AATTACAGGT 


GAAATTGTAA 


AAGGTCCGGA 


ATATCGAACG 


1980 




ATGGAAAATA 


AAACGGTACA 


AGGTGAAATC 


GTTCAAGGTC 


CCGATTTTCT 


AACAATGGAA 


2040 


20 


CAAAGCGGCC 


CATCATTAAG 


CAATAATTAT 


ACAAACCCAC 


CGTTAACGAA 


CCCTATTTTA 


2100 




GAAGGTCTTG 


AAGGTAGCTC 


ATCTAAACTT 


GAAATAAAAC 


CACAAGGTAC 


TGAaTCAACG 


2160 




TTAAAAGGTA 


CTCAAGGAGA 


ATCAAGTGAT 


ATTGAAGTTA 


AACCTCAAGC 


AACTGAAACA 


2220 


25 


ACAGAAGCTT 


CTCAATATGG 


TCCGAGACCG 


CAATTTAACA 


AAACACCTAA 


ATATGTTAAA 


2280 




TATAGAGATG 


CTGGTACAGG 


TATCCGTGAA 


TACAACGATG 


GAACATTTGG 


ATATGAAGCG 


2340 




AGACCAAGAT 


TCAATAAGCC 


ATCAGAAACA 


AATGCATATA 


ACGTAACAAC 


ACATGCAAAT 


2400 


30 


GGTCAAGTAT 


CATACGGAGC 


TCGTCCGACA 


TACAAGAAGC 


CAAGCGAAAC 


GAATGCATAC 


2460 




AATGTAACAA 


CACATGCAAA 


CGGCCAAGTA 


TCATACGGAG 


CTCGTCCGAC 


ACAAAACAAG 


2520 




CCAAGCAAAA 


CAAACGCATA 


TAACGTAACA 


ACACATGGAA 


ACGGCCAAGT 


ATCATATGGC 


2580 


35 


GCTCGCCCAA 


CACAAAACAA 


GCCAAGCAAA 


ACAAATGCAT 


ACAACGTAAC 


AACACATGCA 


2640 




AACGGTCAAG 


TGTCATACGG 


AGCTCGCCCG 


ACATACAAGA 


AGCGAAGTAA 


AACAAATGCA 


2700 


40 


TACAATGTAA 


CAACACATGC 


AGATGGTACT 


GCGACATATG 


GGCCTAGAGT 


AACAAAATAA 


2760 


GTTTGTAACT 


CTATCCAAAG 


ACATACAGTC 


AATACAAAAC 


ATTACGTATC 


TTTACAACAG 


2820 




TAATCATGCA 


TTCTATGATG 


CTTCTAACTG 


AATTAAAGCA 


TCGAACAATC 


GGAAGCATAT 


2860 


45 


TTCTAAATTA 


TTTATTCATT 




nl»rl J. nnLn 1 <J 


H Of*T & A T IT A 
nvv. Inhlnln 








ATTAAAATAA 


ACCACGCACA 


TCTAAGTGAT 


ATACGACAAT 


CACAGCAATA 


ATAATTGCTT 


3000 




TAGAAAGTCG 


TGCCGAACTG 


GAACTTACAA 


GTCTAGTTCG 


AACACACACT 


GATGTGAGTG 


3060 


50 


GTTTTCTTTA 


TTTTAAACAT 


GAACAATCAG 


ATAAGTTACT 


AGCATTAGCA 


AATATTATTA 


3120 




AATCAAAGGG 


CTTCGATTCA 


TAAAATTTAA 


AACAATGATT 


AAAATTAGAC 


GTGTAAATGT 


3180 
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TATTTCACAC AGCTTCATTA ATAAAACGAA ATTGCTTCAA CCCGCTTCAA CTTCAACTGG 3300 

CTTCAACTTC AGCCTACTTC ATTCAATAAC AAAACGAATC CGCTTCATCC AAAATCAACC • 336 0 

ATTCTAACQC ACATATTCAA ATATAGCAGC TGCACCCATG CCGACACCAA TACACATCGT 3420 

AACCATGCCG TAACGGCTAT CGGGACGTCT ACCCATTTCA TTAAGTAAAC GCGCGQTTAA 34 80 

CATTGCGCCT GTAGCACCTA ATGGATGACC TAAAGCAATA GCGCCACCAT TCACATTCGT 3S 40 . 

ACGTGATATA TCTAGACCTA CTTCTTTAAT AGATGCAATC GTTTGAGAAG CAAATGCTTC 3600 

GTTCAATTCG ATCAAATCAA TGTCTTCAAC AGATAGATTG CTGAGTGACA ATACTTGAGG 36S0 

AATCGCATAT GCAGGCCCAA TACCCATAAT TTTCGGGTCA ACGCCTACTG CCTTAAAACC 3720 

AACGAATCGT GCAATAGGTG TCACGCCGAG TTCTTTCACT TTATCTCCAG ACATTAAAAC 3780 

TACAAATCCT GCACCATCAG AAAGTGGGGC AGATGTTCCT GCAGTCATAG TGCCGTCAGC 3840 

20 TTTAAATACT GTACGTAATT TGGCTAATGC CTCCATCGTG GTGTCAGGGC GTATAAATTC 3900 

ATCTTGGTCA AAGATATTTG TGTGTACTTT TGGTCCTGCG TTTGTATATT CAACTGAGTT 3960 

TACTTGTATT GGAATAATTT CATCTTTGAA CCGACCATCA CGTTGTGCGT CATAGGCACG 4020 

2S TTQATGACTT CTGACAGCAT AAGCATCTTG ATCTTCGCGT GATACGTCAA ATTGGGATGC 4080 

TACATTTTCA GCAGTTAAAC CCATAGGATA TGACGCACCT ATATCATCAT ATTGTAAGGT 4140 

TGGATTGTTT GTGGGCTCGT TGCCACCCAT TGGTACGGCA CTCATCAATT CAACGCCACC 4200 

AGCTACAAGT ATATCTCCTT GACCAGCCAT AATTTGATTG GCTGCAATCG CGATGGTTTG ' 4260 

TAATCCTGAT GAGCAGTAGC GATTCACTGT TTGACCCGGT ACCGTGTCAG ATAATCCCGC 4320 

ACGCAATGCA ATCGTTCGTG CAATGTTTTG GCCTTGTAAT CCTTCTGGAA AAGCCGTACC . 4330 

AACAATGACA TCTTCAATCA TATTCTTATT GAATTTTCCG TCAATACGTT TGAATACGCC 4440 

TTGTAATACT TTGGCTGCGA CATCATCAGG TCTTTCGTGG AATAATGCGC CTTGCTTTGC 4500 

^ TTTCGCTGCG GCTGAACGCC CATAAGCTAC AATGTATGCT TCTTGCATGG TTATCATCCT 4560 

CTCTTAATGA CTATCTTTTA ATTACGTAAT GGCTTACCAG TTTTTAACAT ATGTGCAATT 4620 

CTTTCATATG ATTTTTTAGA TTTTAGTAAG TCAATAAAGC CAATTTTCTC CAACGATTGA 4680 

45 ATGTAACGTT GATTGATAAA TGTATTTCTT GGTAAATCAC CACCCGCTAA AATTGTGGCG 4740 

ATATTTAAGG CAATATGATA ATCATGGTCG CTAATAAAAT GACCCCX3TCT TTGCGCATCT 4800 

AATTGTCCTT GGATCAATGC TTTGAAGTCT TCACCTAAAG CGATATATTG ATGTCTAGGA 4860 

TTCGGAATAT AGTTTGTTTC TGCTTCATAT TTCGCACGTT TGAGCGCAAC TTCGACACGT ' 4920 

TGTGCTGTAT TGAAAATAAT CGTATCTGTA TCACGTAAAT AACCATAACG ACGTGCCTCA 4980 

ss 



30 



35 
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TGTTTGTCAX CAAACTTATG CGATGTGCGT AATATGCGAT CAGCCATTTC TGCAAGGCCA 5100 

CCGCCACTCG GTAATAAGCC AACACCTGCT TCAACAAGAC CGATATATGT TTCACTTGCA 5160 

GCGACAACAA TAGGTGAGTA AAGTACAAGC TCACAGCCAC CGCCTAAGGC ACGACCTTGA 5220 

ACAGCTGTGA CTACTGGTTT CAAACTATAC TTCAAACGAT TAAAGCTATA ATGTAATTTA 5280 

TCAATTGATT GTGCAACGAC ATCATCTACA AGACCGTCTT CATGCGCCTT TTTCATTAAG 5340 

AAAAGGTTAG CACCCACACT GAAATTGTTA CCATCTGCAT AAATAACCAT ACTTGTGTAA 5400 

TGGTCATTTT CCAGTAAATC AATCGCATCA ACTAACGCAT CGTTGAATTC ATCGGTAATG 54 60 

ACATTATTTT TACTTTGTAA TTTCAGTAAC AGTTGATCAT CATGAGTTAC GGAAAGTTTG 5520 

GCATCACCTT TATCCCAAAG TTCATCTTTT ACGAAGTGAG AAATAGGTGT TGCATATTCA 55B0 

ATGGTCTCAT CTTGTTTATA AAAGCCACCA TCTAAATCAC TAATCCATTG TGGTAAGTCT 5640 

CCAAGTTCGT CTTCCATACG TGTTTTAACA CGTTCGTATC CCATTGCATC CCATAATTGG 5700 

AATGGACCAA GTTTCCAGTT GAACCCCCAG ACAAGCGCAC GGTCTATGTC TCGGAAATCA 5760 

TCGGTAGCTT TAGGTACATT GATAGCAGAG TAATAGAAAT TATTACGTAA TGTCTCCCAT 5820 

AAAAATAGTC CCGCTTCGTC TTGCGCATTG AATATGGTAT CAAGGTTATG CACTAAGTCT 5880 

TTATTAAATT CATTTAAAAT TGGTAATTGT GGTTOCGATA CAGGTACATA ATCTTGTTTT 5940 

TGAACATCGT AAACAAGTCG AGCTTTAGTT TCTTTATCCT TTTTGTAAAA TCCTTGTTTC 6000 

30 GTTTTACGTC CGAGTGCGCC ATTGTCAAAC AACGTATTTA CAATTTTGAC ATCATGAAAA , 6060 

TAAGGTGTTT CTTCAGGTAC TTGTTGCATG CCTTTAATTA CAGACACTGC AATATCTAAA 6120 

CCGACTAGGT CAGATAGCGC ATATGTACCT GTTTTAGGAC GACCAATCGC TTGCCCAGTT 6180 

35 AAAGGATCGA CATCTACAAT GCTTATCTTG TGTTGCTCGG CGCGATACAT AATATCATTC 6240 

ATTGCTTTGCG TGCCGACTCT ATTTGCGACA AAGCCAGGCA CATCATTGAC GACAATGACA 6300 

CCTTTACCTA ACACATTTTG CGCGAAATTT TTTACATCTA ATATAATAGA TTCCTTCGTG 6360 

40 

TGTGACGTAG GTATTAACTC CACTAATTTC ATAATACGTG GTGGGTTAAA GAAATGTAGA 6420 

CCAAAGAATC GTTCTTGATC CTTCTCGTTA AATGCTTGAG CAATCGCATT AATTGGAATA 6480 

CCTGATGTAT TTGTAGCGAA TAAAGCATCT TCTTTAGCAT GTTGTAGAAC TTGTTGCCAA 6540 

ACAGCATGCT TAATTTCAAT ATCTTCTTTG ACTGCTTCX3A TATATAAATC AGCATCATCA 6600 

TTTAC CAAGT CATCATCAAA ATTACCATAT GTTAAATGAC TCGCTAGATT TAAGTCGAAT 6660 

AGTAGCGGCC GTTTCTTATC TGTAATTTTA TCGT AAGATT TTTTCGCAAT GAGATTTGGA 6720 

TCGTTTTTGT CCACTACAAT ATCTAATAGT TTTACTTTAA GTCCAGCATT CACAAAAAGT 6780 
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GTGATTCCTC CAATTTAGTT GAGGATAAGA TAACCATTAA 
TATTTTATAA AATTAATTAA GTATCTTTGA CAGTCATCTT 
AGCTTTATGC TTAAAATAAG TCTTTTTTAG TGAAATTAAT 
CTATTTATAG GAAAGCAGAA" TCTCCAGTCA AAGCGCGTCC 
CATGTGTACC TTCGTACGTG TAAATCGCTT CTGCATCAGA 
AATCGTCAGC TAGTATGCCA TTACCACCTG TAATACCGCG 
GCAAACGTAA GGCATTCATC ATCTTCGCCG TTGAAGTTGC 
GTGCTTGCAT ATTAGCTAAT TGAGCACATG TTGCCATTGC 
TCATTGCTAG CTTTTCTTGT ATTAACTGAT ATTTACTAAT 
GCTCAGTGAC ATAATCTAAT GTGGCACGTA AAGCGCCAGC 
AAGCAACGCC TGCTCTCGTT GAATAAAGAA TTTTGGCAAT 
TTTGTAAGCG ATCCGCTTCA TCTACTTTGA CATTAGTTAA 
CAATGCGAAG TGCGATTTTA TTATCAATGA CTTCAATATC 
TGACTACAAA GCAATGGGGT TTGCCAGTTT CTTTATTTAC 
CAGATACATG TGCACCACCA ATCCATTTCT TTTCACCATT 
GGCGTTCAGC GACTGTTTCA AGACCTCCCG CAACGTCCGA 
AAGCAAAGCA TGTACGCAGT TCATGTGACT GTAATTTAGG 
CTTTGCTACC TCCGAAATAG AAAGTGTTAT GCCCTAAACC 
TAGCTAAGGA AATATCAAAT CGCGCGAGTA GGTAAGACAT 
TAGGCATTTT GGCGTTTGGA CGATCCTTGT AAAGTAATGG 
CTC&AGATC TTTAAAATAG TCCTCGGGTA CAGTAGCGTC 
TTT CACGGT A CTTACTTTCT AG CAATGAAT CTACTTGTTG 
CTGTTAAACC TTTAGCAATA CTAAGTACAT CTTCAGGAAA 
CTTTTTCAAA TGTCATATAA ATTCCTCCTA AAAATAATAT 
TTTAATTCAA AAACAACACG CTTTATTTGT AAACGCTTAC 
ATCACCTTTA AAGTGTTTGC GAGACTTTGT CATTCATCAT 
CTGGTTTCTG CGTACTGTTT AACGGCATAT GTGTCACTGG 
TATAACCTGC TAAACGACT t CGCATATGTT GATTTAAAAT 
CTTCGCGAAG TATAATGGCT GCAGCAATTG ATTCACCATA 



GATAATTGGA ATAACGTTGC 6900 
AGCCTCTTAT TTAAGGAAAA 6960 
GCATCTCATA TAATTATTTG 7020 
AATTACTAAG GCATTAATTT 7080 
GAAGAAACGT GCAATATCAT 7140 
GCCCATAGCT ACTGTCTCAC 7200 

AACCTCGTCA TATTCACCAT . 7260 
TTGAGCTAAA TTACCTTGCA 7320 
TGGTTTGCCG AATTGc TTAC 7380 
CATACCACCT GTAGCCATAT 7440 
ATCTTTAAAG CTTGTTATGT 7500 
TTTAATTAGG GCGTTAGGAA 7560 
GACGCCATCT TGTTCTGGTC 7620 
TGCGAATACT GGAATGACAT 7680 
GATAACCCAA GTATCGCCTT 7740 
ACCGTGTTGT GGTTCAGTTA 7800 

TACATATTTC GGAATTTGTT - 7860 

TTGGTGAACA CCGAGTAGGG 7920 

GAAAAACTGA AATAGTTGAC 7980 

ATTGTTAAAA . TAATTTAATT . 804 0 

TATCCAATGT TGATTAATAT 8100 

TAAAAATTCG ACTTCACCGT 8160 

TAATGTTTTT AAGACCGTTT 8220 

GAATACTAAT GTGAAATGCA 82 80 

ACTAAATGTC AAAAATTTTT 8340 

TTGTCGAATC GCAAGTTTAT 8400 

TACATACATT CTTGGGACTT 8460 

TTCAGCGTAA TGAGGTTCAT 8520 

TTTTGGATGA TCATAGCCAA 8580 
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AGACATTTTC GCCACCAGTT ATGATTAATT 
CATCGTTGTC CATCTTCGCT AAGTCACCAG 
5 CAGTCTCTGC TGGTTTATTC CAATATC CTG 

CGCCAATCTC ACCAGTAGGT ACTTCCTCAC 
. ACATGACTGC TTTACCAATA CTCATTGGCT 

10 

GTACAAGAGG TGCTTCAGTT AAACCATAGC 
AAGCTGCTTG GATACTTGGT AATGGTTGTG 
TAAAATTTTC AGGATTAAAA TTACTAG CAC 

IS 

TGATAATAAA TGTAGGGTGA TATTGTGCAA 
AACGTTGAAG AATAAGTGTG CCACCTGACA 

2Q CTAAAACATG GAACATTGGT GTTGATACAA 

TCAGCTCTAA GTTTGCACCG TTATGAACAA 
GTGATCCGGT TGTACCACTT GTATAAATTA 

25 TTGCTTGAAA AGGTTGGTGA TAATCTGGAT 

TATCCATATG CAATAAGTTT TGGTCAATAT 
AG AAGAG CAG TTTTAATTGT GCATCTTCCA 

30 GCCAATTCAA TGGTAAAAAA ACCGCACCTG 

TTG CAATATC ATTTGGCGCA AAAATAC CGA 
TTAAATAATG TGCCATATTA TCAGCGCGTG 

35 GTTTTGCGTG ATCAATAACG GCAGGCTTGT 

AATOGAAATT CATTAGTATA CCCCCTTTAG 
TTAAGTTGTC CCCATTTTTC TTTGTAAATG 

40 

ATAATTGGTT TAAAAGCCAT TTGATTCAAA 
ATTTCAATTA GTTTCAAGCC TTGATTGGTG 
TAGATTTCTT GCTCGAGTGA TTGTGAATAT 

45 

GATACAAATT TCTGGTTTTG TCCTTCAGTT 
ACATGACTGC CAGCTACAAA AGTACCTGAA 
50 TCTATAAAGC CACCACATCC ATTTAGTCGG 

TATTGATCAA CCTCAGCAAA GCTAAGATAG 

55 



CTTTTTTGCG GTCAATAATA AATATATCGC 8700 

TTAATAAATA TCGACCATGA AATGCTTTGG 8760 

GCGTGACATT TTTAGCCTTA ATTGCAAGTT 8820 

CGTTATCATC AAGGATACGT GCATCAACGA 8880 

TACGTTTTGA ATTTTCCGGT GTATTAACAA 8940 

CGTTAATAAT GTTTATGCCA TATTGTTTAA 9000 

AACCACCTTG GATGATATAA TCCATAGCTC 9060 

GTAGCGTACT ATAATACATT GTCGGAATCA 9120 

TCATGTCATT CAATTCTTCG CCGTTAAAGT 9180 

TTAATACTGG TAATACAGTA TCGTTAAACC 9240 

TCGTAATATA GTTTGAATTG AACTTATACG 9300 

ATGATTCATA TGAGAACATC ACACCTTTAG 9360 

ATGCTGCAAG ATCTTGTGGT TCAACAGGTG 9420 

TTACGATTTC ATCATATTGC GCCACATCAA 94 80 

CGGTGAGTGA ACTTAAATGT TTTTCAG CAT 9540/ 

CAATGGCTGC AATTTCTTTT GGGTTAAGCC 9600 

TTTTAAAACA AGCAAACAAT AAATCTAATA 9660 

TAACATCGCC TTTTTTAACA CCTTGAGATG 9720 

CATTGAGTTG TTGGTATGTC CAAGATGTTT 9780 

CATCATCGAA GTCTGAACGC GTTTTTATCC 9840 

CTTCACTTTC ATACTTTATG AATTGATTGT 9900 

CTGGTATCAA TTAATTTTAA ATGATCAGCA 9960 

ATATCTTTAT GCAAATCAAG ACCTGGTGCA 10020 

AGTTCGAATA CTGCACGATC AGTAACAAAA 10080 

TGTGCATTAA AGTCGATATG GCTCACATCT 10140 

TCAATGTTTA ATCGTTGATT ATGGCATGAG 10200 

AAGATAATTT TATTTACAGA TTGCGTAATG 10260 

TCATTGAAGT AAGACACGTT GACATTGCCG 10320 

G CAACTG AT A CACCATTGTT ATAAATAAAA 10380 
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CGACTCCCAA CGAATCCACC 
ACACATTCTT CATGCAATAA 
GTATCGCCAT AAGTTAAAAA 
GGTAATGCGG GTTCAGGTAT 
TGACTTTGAA TTACTTGGCG 
AGATTTCCTG GGATAACAAC 
ACTTGTACAA- TAACTTTCCC 
CTCAAGTACG CTTCTTGAGT 
AGTAGTGCCA CATCAACGCT 
ACTAATGAAA CTAAATCATC 
TCAACAGCTG TGTTTAATCC 
CGATAATGAG TTGCAATGAT 
ATTGCTTGTG CCGTTTTGGA 
CGACGTTCTA TAAAATCATC 
AATATAAACG TTAAATCATT 
AGAACTTCGG CGGGTAAGTT 
TTAATGATAT GTTGTAAGTC 
TTTGATAAAA TATAGCGTTT 
GACGTTTAAA ATCAATTAGA 
TTTTGATGGT CGATAACAAT 
ATACTTATAT AAAAATATTG 
ATGAAATACA AAGTGCCCAA 
ATATTAAATT AAAATAGTTT 
TAATCATCGA AGAAATACAG 
TACAGGTGAA GAGGGGATGT 
TAATGAATCT ATCGATAAAC 
TTTAAAAAAC GAAGCAAGAA 
GGGCAATGAT GAAAGCTTAA 
GCATACTAAA AACGAAGCAG 



GAAAATGCCA 
ATTAGAGAGT 
CTGAGCAGCA 
TCCATCAATT 
GTGATTCTTT 
TTCATTCGGT 
ATGATTGGCT 
TAAATAAATG 
AGGGAATGTG 
CGTTGTTCGT 
GATTTTAGTA 
ACCTTGTGGT 
AGAAGCCGTT 
TAAATCCGGT 
GGGCGTATGA 
GGCTACAGCT 
GTGCCATGTG 
TTACACTTTG 
- AATATCTTTT 
TGTAATATCA 
TTCGGAATAT 
TCGAACAAAG 
TATTATGAAA 
AAAAAGAAGA 
CATCAGCAAG 
AAATGGAAGC 
GTTTATTTGA 
ATCTTAATTT 
ATGAAATATT 



ACATCTAAAA 
TCATTATTGA 
CGTCGGAGAA 
CGTTCTTCTC 
TCATCTTCTG 
TTTAGTTGAT 
TTCGCGTTTA 
TTACCTTGTT 
TAATGTAAGT 
GTATTTACTT 
ATAACTCCAG 
AAAAAATAAG 
AAAATACTCA 
GCGGCACCTA 
TATGTGTCAT 
AATGCTGGTA 
ATTTGTTTCA 
TGTAAACCCT 
TATTCTGATA 
AGGGTTTGTA 
AAAAAGTTAA 
TATTTATATT 
AGTGAAAGTA 
GACAACACAA 
TACACAATCA 
TAAAGCGCAT 
TAATGCAACC 
AAAAGATATG 
TATAGCGGGT 



TCGGTTGCAC 
TGCCATAACC 
TCAATTTGCG 
CAGACAAGGC 
TGACGTATAC 
AGTCGTCAAC 
ATGCGACATG 
GATCTGCGTA 
ATGTTTCATC 
TACCGCCACC 
GTAATAATTG 
CTTCAATGTC 
TAATGACACG 
AACTATGAAT 
GTTGCGCTAA 
AACCAATCAC 
AGCAAGTCAC • 
TaCAAGAAAT 
ATAGACACAG 
ATGAATTGAA 
ATAGGTTTTG 
AAAATATGGA 
GGTAAGTCTA 
ACGCAATCaG 
ACTAAGACGT 
GAAACAGCGC 
AAATGAATCG 
CTTTCTGAAG 
ACTGCTAAAA 



ATCATGTTCA 
GATGCTAATT 
ACTATTAAAA 
TGGTAAATAA 
ATAATCGACA 
TAAAGCTTTA 
ATAACACTCG 
TGTTCCTCTC 
GTTGATGGTT 
GTATCTAGGA 
ATTACTCTGA 
ATTATTTTTC 
TTTAATCATG 
ATCATTCGCT 
CACAGCACGT 
ATCACCATCT 
CTCCATCACA • * 
ATAACATAAC 
TATAGACACA 
TATCATTAAA 
ATTTTTAAAT 
AAATCCATCA 
TGGAAGGTCT 
TTGCACCTAA 
CCGACATACA 
AAAATACAGA 
GTAGACTAGC . 
TATTTAAGCC 
CTACGCCAGC 



10500 
10560 
10620 
10680 
10740 
10800 
10860 
10920 
10980 
11040 
11100 
.11160 
11220 * 
11280 
11340 
11400 
11460 
11520 
11580 ' 
11640 
11700 
11760 
11820 
11880 
11940 
12000 
12060 
12120 
12180 
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TTTCACAGTA ACATTTATTG GATTATGGGT CATGGCAGCA ATTTTTAATA ACACTAACGC 12300 

GATTCCGGGT CTCATTTTTA TAGGGGCTTT AACAGT AC CA TTATCGGGTT TGTTCTTCTT 12360 

TTATGAATCA AATGCGTTTA AAAATATTAG CATTTTTGAA GTTATTATCA TGTTCTTTAT 12420 

TGGCGGCGTA TTTTCATTAC TAAGTACGAT GGTATTATAT AGATTTGTCG TTTTTAGTGA 12480 

TCAATTCGAA AGGTTTGGTT CTTTAACATT TTTCGATGCA TTTTTAGTAG GATTAGTTGA 12540 

AGAAACTGGA AAAGCACtCA TTATTGTTTA TTTCGTCAAT AAATTGAAAA CAAATAAGAT 12600 

TTTGAATGGA TTATTAATCG GTGCTGCTAT TGGTGCAGGG TTCGCAGTTT TTGAATCAGC 12660 

AGGTTATATT TTGAATTTCG CTTTAGGAGA AAATGTCCCA TTATTAGATA TTGTCTTCAC 12720 

ACGTGCGTGG ACTGCGATTG GTGGTCATTT AGTTTGGTCA kCGATTGTTG GTGCTGCAAT 12780 

AGTTATTGCG AAAGAACAGC ATGGCTTTGA ATTCAAAGAT ATTTTTGATA AACGCTTTTT 12B40 

AATATTCTTT TTATCAGCCG TTGTTTTACA TGGCATTTGG GATACATCTT TAACTGTACT 12900 

TGGCAGTGAT ACGTTGAAAA TATTTATTTT AATCGTTATT GTGTGGATAC TTGTATTCaT 12960 

TTTAATGGGG GCAGGTTTAA AACAAGTGAA TTTACTGCAG AAAGAATTTA AAGAACAACA 13020 

GAAAAAAGTA GACGAATAAT AATTAAAGCT TATGTTGCTC ATATGTTTGT GACATAAGCT 13080 

ATTTTTATAA TTTGTCTTTA AAAGAGTGGA ATAGGAATAC TTTTTGGAGT TAAAAAAGTG 13140> 

TTtCACGTTA AACAAATAGT GACAATTAGA TTTATATAAA ATGAACATGA TTCACTGAAA 13200, 

GTATGTAATA ATCATTTTAT TGAAATTCAT CAAACAGAAA TTAATAGAAT CATATAAGCA 13260 

AATTAAACCA CGCCATAATC ATATTGGATG ACTTCGGCGT GGTTTTTATA GTTGAAGCAG 13320 

GGCTGAGACA TAAATCAATG TCCCACACTC CCTTATCGTT CAATCGTTGT TCGATAATCG 13380 

ATTAAATAGA TACCTTCAGG TGTTACTTTA TAATTTTTAA CCTTAGAGTT AGCAGCGACT 13440 

ATTTS3ATCGT TGTAAGCAAT ATAACTGTTT GGTACATCTC GACTTGATAA TTTAATAATA 13500 

TCATTAGAAA TATTGTGACG TTCCTTAACA TCTACAGTAT GATTCAATTG ATTAATTAAA 13560 

TCATCGACGT TGCTATTATT GTAGTCTCCT TTATTAATAG CACCATCTTT TTTATATGCT 13620 

TGATTAAAGA AATAACCTGT ATCTCCACGA GGAATTGTTC CGAAACTATA CATCGTTGCA 13680 

TCCCATGCAG AACGGTCTTT TAAGTAACCT TCTATGTCAT CAACACTTTT AATGTCGATT 13740 

TCAATATTTG CTTTTTT A GC ATCTGATTGT AATACTTGCG CAATTTTCGA TAGCTCTGGA 13800 

CGACCGTCAT ACGTAATTAA CTTAATTTTT AAAGGGTGTT CTTTTGTATA ACCATCTTTA 13860 

GCTAATAACA TTTTTGCTTG TTCGATATTT TGTTTGGTTA ACTTAGGTTC TTTAATATAT 13920 

GGAATTTTAT CATTAAATGG ACTCGTTGCA GGTTTCGCAT AACCTTGATA AATATGATCT 13 980 
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TTATt AGTAT GATTATACAT AAGTaAGAAG TTCTAAAn 
(2) INFORMATION FOR SEQ ID NO: 192: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 486 base pairs 

(B) TYPE: nucleic acid • 

(C) STRAND EDNESS : double 

( D ) TOPOLOGY : 1 inear 



14078 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 192: 
15 TGAAAACTAA AGTGTTTCTA ATGCGTGACT AAAATTAGTA ATAATTAAGT TCTCATGATA 

ATAGGTATTT TTGAAAAATG GAGGAGTCTA TAAATGGGTA AAAAAATGGG TCTAGGTTTA 
TCTATTGCAT TGGTTGTTAT TGGTATTGCC GTTGTATGTT TAATGATTTT TTCTAGTCAA 
20 AAAACGACTT ATTTTGGTTA TATGAATAGT AATACAAATG CAGAAAAAGT TCTCAGTGAA 

AAAGATGGAT TAGTCAAACA TAATATCAAA GTAGAACCAT CTAATGATTT CAAGCCGAAA 
AAAGGAGACT TTGTAAAATT AGTTTCTAAA GATGATGGGA AGACATTTTA TAAACAAGAG 
ATTGTTAAAC ATGATGACGT CCCACACGGT TTAATGATGA AAATTCACGA CATGCATATG 
AATTAATAAA AAAGCATCTA TAACGTAATT TTGAAGAAGT AGAGTTATCT TCTTATGCGT 
TTTAGA 

(2) INFORMATION FOR SEQ ID NO: 193: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1626 base pairs 

(B) TYPE: nucleic acid 
35 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

40 < xi > SEQUENCE DESCRIPTION: SEQ ID NO: 193 : 

GAGGTCTATA TACAATTATG GTTGTTCCAG TTAAACGAAC TGATGGCTTT ATTACTAAGT 
TTAATAGATT AATTGAAAGA CGATTATTAC GTCATTTCAG TAAAAAAGGT TATATCACAT 
45 GGGAGGAAAA TTGATTGTCT GACATTTTAA AATGTATCGG TTGTGGTGCG CCACTTCAAT 

CTGAAGATAA AAATAAACCT GGTTTTGTAC CAGAGCATAA TATGTTTCGT GATGACGTGA 
TTTGCAGACG TTGTTTCCGC TTGAAAAATT ATAACGAATT CAAGATGTAG GATTAGAAAG 
TGAAGACTTT TTAAAATTAT TATCAGGACT TGCGGATAAA AAGGGTATTG TCGTCAATGT 
CGTGGATGTA TTTGACTTTG AAGGATCATT TATTAATGCA GTTAAACGTA TTGTCGGAAA 



60 
120 
180 
240 
300 
360 : 
420 
480 
486 



60 
120 
180 
240 
300 = 
360 
420 
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TCGAGTTAAA 


GAATGGTTAA 


AACGAACAGC 


AAGAAAATAT 


GGTTTGGAAG 


CTGACGATGT 


540 


CGTATTAATT 


TCAGCTGAAA 


AAGGCTGGGG 


CATAGACGAC 


TT ATT AT CAT 


CAATTGCGAA 


600 


TATTCGAGAA 


AATGAAGATG 


TGTATATTGT 


AGGGACAACG 


AATGTTGGGA 


AATCTACATT 


660 


GATTAATAAA 


CTGATTGAAG 


CTAGTGTTGG 


TGAAAAAGAT 


GTAGTAACAA 


CTTCAAGATT 


720 


CCCTGGAACA 


ACTTTAGATA 


TGATAGATAT 


TCCTTTAGAT 


GAAACATCAT 


TTATGTATGA 


780 


TACACCAGGT 


ATTATTCAAG 


ATCACCAAAT 


GACGCATTTA 


GTTAGTGAAA 


AAGAATTGAA 


840 


AATTATTATG 


CCTAAGAAAG 


AAATAAAACA 


ACGCGTATAT 


CAATTAAATG 


AGGCGCAGAC 


500 


ATTATTCTTC 


GGCGGTCTAG 


CGCGCATAGA 


TTATGTATCA 


GGTGGTAAAC 


GTCCGTTAGT 


960 


TTGTTTCTTT 


TCTAATGACT 


TGAATATACA 


TCGTACTAAm 


ACGGAGAAGG 


CTAATGATTT 


1020 


ATGG CGTAAT 


CAACTTGGCG 


ATTTATTAAC 


GCCACCTGGA 


AATCCACAAA 


ATTTTGATCT 


1080 


TAATGAGGTA 


AAGGCTGTTA 


GACTTGAAAC 


AGGCAAAGAG 


AAACGCGATG 


TT ATGAT CT C 


1140 


TGGTCTAGGC 


xxx x fwiv x n 


TAGGACCAGG 


GGCTAAAGTA ATCGTTCGTG 


TTCCTAAAAA 


1200 


T£3 T*Pfl & lc C5 T*I* 


GTATTAAGAA 

\7 x /i x x nnunn 


ATTCTATTTT 


ATAAGGTGaT 


TAAAAAAATG 


AAATTTGcAG 


1260 


TTATAGGAAA 


x ini x x w**» 


CATTCCTTGT 


CGCCCGTTAT 


GCATAGAGCA 


AATTTTAATT 


1320 


CTTTAGGATT 


AGATGATACT 


TATGAAGCTT 


TAAATATTnC 


CAATTGAAGA 


TTTTCATTTA 


1380 


ATTAAAGAAA 


TTATTTCGAA 


AAAAGAATTa 


GAAGGCTTTA 


AT AT CACAAT 


TCCTCATAAA 


1440 


GAACGTATCA 


TACCGTATTT 


AGATTATGTT 


GATGAACAAG 


CGATTAATGC 


AGGTGCAGTT 


1500 


AACACTGTTT 


t G AT AAAAG A 


TGG CAAGTGG 


ATAGGGTATA 


ATACAGATGG 


TATTGGTTAT 


1560 


GTTAAAGGAT 


TGCACAGCGT 


TTAnCCAGAT 


TTAGAAAATG 


CATACATTTT 


AATTTTGGGC 


1620 



GCAGGT 1626 

(2) Information for seq id no: 194 : 
(i) sequence characteristics: 

40 (A) LENGTH: 635 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

45 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 194: 
AGGGTTAATT GTCGGTTTAA TTGCAATGAA TAAGTTC CAT GTATTAGCTG GCTATAGAGC 60 
50 GAAATTCATC TTAATGGTGA TTTTAACTAT GATGGTCTTC GTACTTATTA ATACGTATTT 120 

ACTAAGACAG GTAAAATCTA TCGGTATGTT CTTAATGATT GCTGCATTGG GTCTATACTT 180 
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GTCTTATATC GATAACATGT TCTTCAATTA TTTAAATGCA GAGCATCCTA . TAGGCTTGGT 
GCTAGTAATA TTAACAGTAC TTGTGATTAT TGGCTTTGTA CTGAACATGT TTATAAAACA 
CTTTAAGAAA GAGAGATTAA TCTAATGTTG ATGAATAGCG TGATTGCTTT AACTTTTTTA 
ACAGCATCTA GCAATAATGG CGGACTTAAT ATTGATGTGC AACAAGAAGA GGAAAAGCGA 
ATCAATAATG ATTTAAATCA ATATGATACA ACGCTATTTA ATAAAGACAG CAAAGCGGTT 
AATGATGCGA TTGCTAAGCA GAAAAAAGAA CGACAACAAC AAATAAAAAA TGATATGTTT 
CAAAATCAAG CGAGTCACTC GACTCGCTTG AATGA 
(2) INFORMATION FOR SEQ ID NO: 195: 



<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13715 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
20 < D > TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 195: 
CTGAAATGGG TATTATTTGT CTTCTTCATC ATAAAGT AAT AAAGATTGTT CATCATTGCG 
ACGTTGCCAA TTTTCATTTG GCGATCTTGG AACGTATAAT AATTGCCTAG TAGCATACGC 
TTTGATTGAA ACATACAAGT CATTCCTTGA ACTTGCACCT CAATTTCCAC: ATTTGAATTT 
TCTTTTATAT TAATAATTTC ATCCAAATTC AGCTCACGTGr CTAAGACAGC . TCTTGATGCG 
CCTCTTTTAC CCCAGTAATT ACATTGAAAA TGATTAGTTA CTAACGTCTC TGCATTCCAA 
TGAAGTGGTA TTGGATTTTC TTGCGCCTTC ACATACATTA CTACTGCTGG ATCCCCGAAA 
ATAATTCTGT CAACTCGTAT TTCATGTAAA AAATTAATAT , AATCTTCTAC r. AGCATCTAAA 
TGATAATTAT GAAATAATCC ATTCACTGCC GCATATACTT TTTTATCGTT TTTGTGAGCT 
AATGCGACAG CCTCTGTCAT TTGTTGTCTA TTGAATTCCC CTGGAAGTCT TAAACCAAAC 
TTTTGCTCGC CAATTACAAA AGCATCTGCA CCTAAATCAA TAAGTGTTTC CATATGGCTT 
AATGACTTGG GTGTGACAAG TAATTCTGTC ATAGTCATTC TCCTTTAATT GAAATCGCTA 
45 ATCCATCGTC TATATTTAAA AAATTCGTTG TATATCCTGG TTGCTTTATT AAC CACTCAT 

TATAATCTTG AACCTTTTTA ACCATTTGTC TTACATTTCT CGATCTAACA ATCCCAATAT. 
CCGATACAAA ACCGTGATAT AAAACATTAT CTGTAATTAC GAGACCTTGG TGCTTTAAAA 
GTGGTGTATA TATTTCAAAA AATTTCTTTG ATTGCGCTTT TGCTGCATCA ATAAATATCA 
TATCATAAAC TTTGTCATTT ACATTTTCAA ATTGCTCTAA AGCATTACCT TCAATAATTC 



300 
360 
420 
480 
540 
600 
-635 
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CATTACGCTC TATCGTTGTG ACATGAATGT CATCAGATAT AGAAGCGAAT TGCATAGAAC 1080 

TATAGCCGAT TGCTGTACCA ATTTCTAAAA TATTTTTAAC ATTATTCATA CGAATTAATt 1140 

5 GCTTAATTAA ATCTAATGTT AAACGATCTA CAATTGGCAC TTCATTTACC TCGGCAAATT 1200 

CAGGCAAAAC TTCGATTGAA CTATTTTGAT GTTGATGTAA ATCTATTAAA TATTTTTTAT 1260. 

TTAGGTCATC CATGTTTTAA ACTTCCTTTA TGTAAAATAA GTCAATATGA TTATGACAAT 1320 

10 AAAATAAATC AGCCTTCACA ATTGATTATA ATTTTGCCAA CGAATTAAAT GACTGATTTC 1380 

GTGTTAGACG CAAAGCTATT TTATTTATAG AAGCGAATCA TTCATATAAA ATTTAACTTT 1440 

AGATATTTTA CCATATTTTC AATAAAATTA TAAGCGTTAA TTATTTATAG ATTGCTTGAC 1500 

IS 

TTAAAAAATA CTCTTGCCTC CCCATCTTTA AGGTTAGCAA GAGTAAAATC TTTTTAATTA 1560 

TTCTTCCATT TCAGTATTTA CAACTTCTTC AATCATGTCC CATTCTTCAT CAGTTTCGAT 1620 

TGGTACTAAC TTACCACCGT CACCTGACTC ATCTGGTTCA TTGATCATTG GTACAAGCTC 16 80 

20 

AATCATATCG TCTTCATCTG ATTGAGCACC TTCTTCAGCT AAGATAACAT ACTCTTTTTT 1740 

GAATTCAGGA TGATAAAATT CTAAAACTTT TCGGTATAAA ACTTCATTTC CCTCTTCATC 1800 

2S GAATAAAGTT AATAATTCTT CTTCGTTATT AATTTCTAGT TGTGAATCAT GATTATGTTC 18 60 

AGTCATAGTA AAATCTCCTT TTAATGTAGT GAATCTAAAT AGCCTTGTAA AATAAATAGC 1920, 

GCTGCCATTT TATCAATCAC TTGTTTTCTT TTTTGTCTTG AAACATCTGC TTCTAATAAT 1980 

30 GATCGTTCAG CAGCCATTGT GCTTAATCTT TCATCCCACA TCACAATCTC AATAGAAGGA 204 0, 

TAAGCTTCTA ATAATTTTTC TTTATATGTT AACGAAGCTT CGCCTGGAAA TCCTATTGAA 2100 

TTATTCATGT TTTTAGGTAG TGCTATTACG ACTGTACCCA CATTATGTTT TTTAATAATG 2160 

35 TCTACTAATT GGTCAATACC TAATTCATTA T TTT CT TCAT TGATTCGGAG TGTGTCTAAT 2220 

CCTT5TGCCG TCCAACCCAT TATATCACTA ATTGCAATTC CTACCGTTCT ACTACCGACA 2280 

TCGAGTCCTA AAATTTTATG TTGTAACATA AATTATTTAT TTTGCTCTTT TAAATAGTAA 2340 

40 

GAAACAAGGT CTTCCATAAT AACATCTCTA TCAATATGAC GAATTTGATT TCTTGCTTCA 2400 

TTTTGGCGTG GAATATACGC AGGGTCACCT GATAATAAAT AACCTACAAT TTGGTTTACG 2460 

GCATTATATC CTCGTTCATC TAATGTTCGA TAAACATTAT TTAAAACATC TCTTACATCT 2520 

45 

TGCGTTGGAA GTTCTTCATA GTCGAATTTC ATTGTTTTAT CAAAGTTTTC CATTTGCGAC 2580 

ACTCCTTTAA TTACAAATAT AACTCACTAT CAT CAT ACAA TATTATGGCT TTAAATTATA 2640 

50 GATTTTTAAT GTAATCTTTA ATAAAGCTTA ATGATTTTGA GATATTTTCA GGTTGTGTAC 2700 

CGCCACCTTG AGCCATATCT GGACGACCGC CACCTTTACC ACCAACGATT GGTGCCATTT 2760 
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TCGATACTTT ATCATCAACA TTACTTGCAA GAATGATAAT TGTATCTTGT AGTTTAGATT 
TAAAATCGTC CATTGTCGAG CGAATTGCTT TCGCATTTGG TACATCCACT TCAGTAACCA 
ATACTTTATA GCCATTGATT TCTTCAACTT GATCITCAAT ATTACCCATT . TTAAGTGATG 
TGATTTCTTT GTCACGTTGC TCTAATTGTT TTAATAATGC TTTTTCTTCA TCTTGTAATT 
GTGTTAACTT ATCGACTACT TGATCATCAG ATTTCACTTT CAGCTGTGAT TTCATCGTAT 
TAAATTTCTC TTGAATATCT TCTAAATATA AGAAAGCTGC TTTACCTGTT AATGCTTCAA 
TACX3ACGCAC ACCAGCTCCT GTACCTGACT CACTTACTAT TTTGAATAAG CCAATTTCAG 
AAGTATTGCG GACATGAATA CCACCAGATA ATTCAATTGA AAATGGTGCC ATATTTACTA 
CACGCACAAC ATCACCATAT TTTTCACCGA ATAATGCCAT TGCGCCCATT TCTTTAGcTC 
AAGCAATATC CATTTCTTGA ATGTTAACGT CAATACCTTT CCAAATTTCT TCATTTACTA 
AGCGTTCAAC TTGATCAATT TCATCATTAG TCATTGGACC AAAATGAGAG AAATCAAAAC 



GTAAACGATC TGCTTCTACT AGTGAACCAG CTTGGTTAAC ATGATCACCC AGTACTGATT 
TCAACGCTGC ATGTAATAAA TGTGTTGCAC TATGGTTCTT TTGAATGTCA CGTCGATCAT 
2S TTTGGTTCAC TTCAGCAGAC ACTGTAGCGC CAACATTTAC TTGGCCAAAT TGTACTACTC 

GTTTATGCAA GTTTTGACCA TTTGGTGCTT TGGTTACTTC ACTAACAGCA ATTTCAAAAT 
TGTCATTATA AACAATACCT GTATCCGCAA CTTGTCCACC. ACTGATTGCA TAAAATGGTG 
30 TTTCCGTTAA CATGAAGTAT ACTGTTTCAC CCGCTTCAAC . TTGTGAAACT . TCTTCACCAT, 

TGTATATCAA GTGTGTTAGT GTTGTTTGAG CtGTCGCAGT ATCATAACCA ACAAAAGTAC 
TTGCAGATGT AATATTTTTC AATACTTCAC TTTGAACTTG CATTGATTGA GAATTTTGAC 
GTGCTTGACG TGCACGATCA CGTT6TTGTT GCATTTCTGA CTCGAATGTT . GTCATATCAA 
CTT^PAATCC TGCTTGCACT GCTATTTCTT CAGTTAATTC AATTGGGAAC CCATACGTAT 
CATACAATTT AAATGCATCT TTCCCATTAA TTTCATTTGT TGTCGGTTTA GCTTTTTTAA 
TTAATTCATT TAAAATCGCT AAACGATCTT CTAATGTTTC ATGGAATCGT TCTTCTTCAG 
ACTTTATAAC ACGCTTAATG AAATCTGCTT TTTCCTTAAC ATTTGGATAA TATGGTTCCA 
TAATGTCTGC AACAATATCA ACAAGTTTGT ACATAAATGG CTCATTGATT CCTAACGTTT 
GACTAAAACG AACGGCACGA CGTAACAATC GACGTAATAC ATACCCTCTA CCTTCATTGG 
CAGGTAATGC ACCATCAGAA ATTGCAAATG CAATCGTACG AATGTGGTCA GCAATTACTT 
, TAAATGCCAC ATCTTGTTCG TTGTTTACTA AATATTGTTT ACCTGATACT TTTTCGATTT 

CATTCATTAT AGGCATAAAT AAATCTGTTT CATAGTTAGT ACGTACATTT TCAGAAACTG 
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TATGATCTTT ATTATGATTG AATTCACTAA ATACTAAGTT CCATACTTCA AGATAGCGTT 4680 

CATTTTCTCC ACCTGGATAC ATTTCTTCTG CCGGATCGTC TTGTCCATAT GCTTCTCCGC 4740 

GATCATAGAA AATCTCAGTG TTCGGTCCTG AAGGCCCTTC ACCAATATCC CAGAAGTTAC .4800 

CTTCAATGCG AATAATACGA CTTTCTTCAA GCCCAATATC TTTATGCCAA ATGTTGTATG 4 860 

CTTCCATATC TTCCGGATGA ATCGTAACGT ACAATTTATC TGGCTCCATA CCCATCCATT 4 920 

TATCACTCGT TAAAAATTCC CAAGCAAATT CAATCGCTTC TTGTTTAAAA TAATCACCAA 4980 

TTGAGAAGTT ACCTAACATT TCAAAGAATG TATGGTGACG CGCTGTGAAA CCAACATTTT 5040 

CAATATCATT TGTACGAATA GCTTTTTGAG AGTTTACAAT TCTTGGCTTT TTAGGTGTTt 5100 

CACGTCCATC AAAATATTTC TTTAATGTTG CTACACCTGA ATTAATCCAT AATAATGTAT 5160 

CATCATCAAT TGGCACTAAT GGTGCAGAAG GTTCAACCAT ATGTCCTTTT TCAACAAAGA 5220* 

AATCTAGATA TTTTTGTCTA ATTTCACTCG CTTTTAACTT TTTCATCATT TACACATCCT 5280 

ATTTACTGTT TTTAAATTAC CATTCCATAA AAATTGATGA CACAGATAGT CGATTTGCAA 5340 

AACTAGTATA AATCAATATC ATTTTTTATT ATTAAAAAAT AAAAAACGCC CATCCTCAAA 5400 

AGGGACGAAC GTTATCGCGG TACCACCCTA GTTATAAATG CAATTCAACA CATTTATCAC 54 60 

TTTAATTCGA CTATACAGTT GTGCATAAAG TAGCGTTCAC TAATGTTTGT tGTACTTTTC 5520 

ACCAACCAGT ACATCTCTGA TAAACAAATC aTTAACTACT CATCTTTATA CGAATTTAAT 5580 

TCTATTTTAG TTACATTTAC GCTTGTTGTC AACGTTCTAT AAAGTCATAC GGCGTGATTT 564 0 

CTCCCATATT AATCATTGGG TCAATTTTAA ACATTGTAGC TTCCGTTAAT ACATTTGTAT 5700 

CTGTTTTTGT TGAATCAGAC ATAACTTCTT CACTATCATT CGATGACATT GGCGCTTCTA 5760 

CTTGATCATC TATTGTCGTT TGTGAAGCTC CTGTATCATT AgTTGCTGTG TTTTCCAgCA 5820 

TTTCaTCATC TTCTGAATTA AAATAATTTT TCAAGAATGT ACATAATTGT GTTAAACGCG 5880 

CTTGACCATT TGTTTTCAAT CCAATATCAA ATGCTTCCGG ATCACCAAGT AAAACTAAAC 5940 

TCGTTTTCGC TCTAGTTAAA CCAGTATATA ATATCGGTCT TTGTAACATT CTAAAATACT 6000 

GTTTAACAAT AGGCATGATA ACAATAGGAA ATTCTGAACC TTGTGATTTA TGGATTGATG 6060 

TACAATAAGC ATGTGTTAAT TCCATCATAT CTTGTTTCGT AAATGTAATT TCATTACCTT 6120 

CAAAATCCAC AACAAGTACA TCTTTATTAA GGGCATTTTC TTTCGCCCAA AAAATACCAA 6180 

CAATAACTCC TATGTCACCA TTGAATATGT TATCATTTGG CCTATTAACA AGTTGTAATA 624 0 

CTTTGTCACC TTTTCTAAAG ACTACATCAC CAAACTCAAT TTCTCGTGTG TCTTTCTTTT 6300 

TAGGGTTTAA . AATATCTTGT AAAACTTGAT TTAAACGTTT AATACCGGCA TTTCCTTTAT 6360 



55 



900 



EP 0 786 519 A2 





CTACCTTCTC 


AACAACTGTT 


GGTATTTGGT 


TTGCCTGACA GTTAAT AAAA CTTCTATCAT 


6480 




GAAAACGCTG 


TGTAATATCA 


ATTTTCTGAC 


CCAACTTCAT 


TCGATGTGCT 


AATTCTATAA 


6540 


5 


TGCTTGAACC 


ATCTTGTTGA 


CG ATATAGTT 


CAGTCAGATT 


TACTCGTGGT 


ATAGCTTTCG 


6600 




ATTCAATTAA 


ATCTTTAAAT 


ACTTGACCAG 


GACCTACAGA 


AGGCAATTGG 


TCCTCATCAC 


6660 




CT AC AAAT AT 


CAATTGTGCA 


TCTAAAGGAA 


CTGGACTTAA 


AAATTGGTGG . 


AACAACCAAG 


6720 


10 


TATCTACCAT 


AGACATCTCA 


TCAATGATTA 


TGAGTCGTGC 


GTTTATTTCA 


TTTTCTAATA 


6780 




TATCCTCTGG 


CTTTGTGTCT 


TGATTCCAAC 


CTATTAAACG 


ATGAATCGTC 


ATTGCTTCTA 


6840 


15 


ATCCAGTTGA 


CTCTTGTAGT . 


CTCTTAGACG 


CTCTTCCTGT 


TGGCGCTGCT 


AATACAACTG 


6900 


GATAATCATC 


ATTGACATAA 


TCATCATAAT 


CTAATGATAA GCCATGAATC TCAGCATATA 


6960 




ATTCAACAAT 


ACCTTTAATT 


ACTGTCGTTT 


TTCCTGTTCC 


CGGTCCACCG 


GTTAATAGCA 


7020 


20 


TCACCTTAGA 


ATTGATAGCC 


GTTTGCAAAG 


CTTCTTTTTG 


TGAAGCTGCA 


TAGTTCACTT 


7080 


GATTCGCATC 


TTCTATTTCA 


CCAATATGCA 


TTTGTAAATC 


TGACTGTTCA 


ATTTCTGTAA 


7140 




GTTTATTXGX 


ATGCGTCTTT 


ATTCTGAATA 


AGTTTTGAAC 


ACTTTTGATT 


TCaGAATAAT 


7200 


25 


ACAAACTTGG 


AATTGCAACT 


TGTTCaTTGT 


CAATAATTAG 


TCGTTTTTCC 


TCATTTAAGT 


7260 




ATTG CAACAT 


TTCGTCTAAT 


TTTTCAGGTT 


CGATGACCTC 


TTCATCTTGa 


TAATTTAATA 


7320 




CATCAACCGT 


TAAATCTATA 


ACAACATTGA 


TAGGCAAATA 


TGTATGTGCC 


TGTTTAATAC 


7380 


30 


ATTCTTCTTC 


TAACGTATAG 


AG CAACGCAG 


CTTTTAATCG v TTCATTATCG 


TTATAAGCGA 


7440 




TACCAATATT 


TCTAGCAAGT 


TGATCTGCTT 


TATTAAAACC 


AATACCTTTA 


ATATCATAAA 


7500 




TCAATTGATA 


TGGATTTCGA 


TCTAAAATAG 


TCAGTGT ATC 


GCCGAGATAA AACTGATAAA 


7560 


35 


TTGCCATTGA 


AAGTTT AGGA 


CCAAACCCTA 


AATCATGTAA ACGAATCATT. ATTTTTTCAG 


7620 




ATTCTTGATT 


TGCTGAAATT 


TGTTCTGCAA 


TTTGTTTCTG TTTCTTTTTA 


GATAATCCCG 


7680 




AAACTTTTTC 


TAGCACTGAA 


TGGTCATCTA 


ATATATCATT 


TATCGCATTG 


TCACCTAATG . 


7740 


40 


TATTAACAAT 


ATTTTGAGCT 


GTCTTTTTAC 


CTACACCTTT 


AAACAAATCA 


CTAGATAAAT 


7800 




AAGTTATAAT 


TGCTTCTTTC 


GTTTGTGGCA 


TTTCTTTTTC 


AAAAGTCTCT 


GCTTTTAATT 


7860 


45 


GTTTACCATA 


ACGTGGATGA 


1 LMLAAL 1 1 


GCCCTTTAAA 


TGTGTAGACA 


TCGCCTTCAA 


7920 


CAATATTCGG 


AAGAAACCCT 


ACAACAGTTG 


GCATTGTATC 


AAAGTCTTCA 


TTTGTTTCAA 


7980 




TAGTATCTAC 


TTTAAGCACT 


GTATAAAAAT 


TATCACTGTT 


TTGAAACAAT 


ATCGCTTCAA 


8040 


SO 


CAGTACCTTT 


GATCATTGAA 


TAATCAAATA 


GTGTAGGGTC 


TGACATGTTA 


CTCCTCCTCT 


8100 




TTCATTTTAG 


TGAATGTTTT 


CAGCGCATGC 


TGACTTAATA 


AGTGTTTAGG 


GTCGATAGTC 


8160 
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AAG CCCAAAT TGTATCTTGC ATCAACATGA TTTTTATCAA TCGTTAATAC ATGTTTAAGT 8280 

TGAGTTATGG CTTCATTAAA CATTTCTAAT TGACATAATA CAAGACCATA TTGAAATTGA 8340 

5 ACTTCTGCAT CTTTGTCTTT ATCTAGTTCC GCAGCAGTCA TTAAATACGG CAATGCCAAG 8400 

CTTAAATGAT TCTAACTGAT TAAACGCCAT ACCGATCATA TAATTACAAT CAACTTGTTC 8460 

AATCTCTGTT TGTAATGCTT GTTGATATAA TTTAATAGCT TCTTGATAAC GTTGCTGATT 8520 

10 

ATAATATACA TTTGCTAGAT TAAAAAATAC GACGCCATTC TTCGGATCTA TTGTnAAAGC 8580 

TTTTTGGAAA AAACGCTCTG CCTTTyCAAy CyCATTCgCA TCAGCAAGTA CGATmCCaGC 864 0 

ATTAATATAA TTTTCAATAA TTGTAGGATT TTCTTCGATA TTTCCGAACA ATGCTTGTAA 8700 

15 

CGCTTCTTCT ATTTTTCCAT TTTGTATGTA TTGATAAATT GTTTGTTGAT CTATCATTTA 8760 

CGAACCTCAT TTCTCATCAA TTATAACATC TTGATAAATT GTATGTCTCG AATCACTTAA 8 820 

2Q CAACGAATAA AATATAATCT AATATCATCT TCATTCATGA AAAAGCGGGA ATGGAATAGA 8880 

AATGCTTAAG AACCATTAAC GGTTTATTAT GTAATGGTTC TTCCACATTA GCCACCACTA 8940 

TTATGTACTT AAAAATAAGA ATACATAATT AGATTCATGC ATAGGGAGTG GGACAGAAAT 9000 

25 GATATTTTAA CAAAATTAAA TTCGTTATCC CCAACTGGCA TTGCCTGTAG AATTTCTTTA 9060 

CGAAATTCTC TATGTTGTGG TCCCGCCAAT ATAACATTGT AGAGCCTAGG ACATTGTGAT 9120 

GTCCCAGACT CTATCCTCAT GAATTATTCT CATCAAAAAC TGTCTTTCGT CATTTTCAAC 9180 

30 GTTGAAACTT, CAAATAAGTA ATTTATTGTT GCCATTGTTT ATACAACATA ATTTAATTGA 9240 

CCTTCATTTT TGAACACATC GTCAATTGTT GCACCACCAA GACACACATC ACCTTGATAA 9300 

AAAACAACTG .CTTGTCCAGG TGTGATTGCT CTTACTGGCT CAGCAAAAGT AACACGTAGg 9360 

35 

CAtGGtCGTT TTCACGTTTC ACAAAAACTT TCGTATCTTT TTGGCGATAT CTAAATTTAG 9420 

CTG t ACATTC AAAACCTTGA TCTAAGTCAT TATCTTCTGG ATTTACAAAT GAATAGTCTG 9480 

AAGCAATTAA GTAATCACTG TATAATGCAT CGTGATGGAA TCCTTGTTCT ACATATAAAA 9540 

40 

CATTATCTTT TAGGTTTTTA CCGACAACAA ACCAAGGATC GCCATCTCCA CGTATACCTA 9600 

ATCCATGTCT TTGTCCTATT GTGTAATACA TCAAACCACT ATGTTTACCC ATTTTCTTAC 9660 

CATCAAGTGT TATCATATCA CCCGGTTGTG CAGGTAAATA TTGTGATAAA AATGTTTTAA 9720 

45 

AGTTTTTTTC GCCGATAAAA CAAATGCCTG TAGAATCTTT TTTCTTAGCA GTAACAAGTC 9780 

CTTGTTCTTC AGCAATTCGA CGCACTTCAC TCTTTTCGAT GTCGCCAATT GGGaACATCA 9840 

50 CTTTTGAAAG TTGTTGTTGA GATAATTGAT TCAAGAAGTA TGTTTGATCT TTATTATTAT 9900 

CT ACAC CACG TAACATTTCA ACATGACCAT CTTCATGACG ATGTATGCGT GCGTAATGTC 9960 
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TTTCTTTATT ACACATAACG TCTGGATTTG GAGTACGACC 


TTTTTTGTAT 


TCATCTAAGA 


10080 




AATACGTAAA GACTTTATCC 


CAATATTCTT 


TTTCAAAATT 


AACAGCGTAA 


TACGGAATGC 


10140 


5 


CAATTTGATT 


ACACACTTCA 


ATAACATCGT 


TGTAATCTTC 


AGTTGCAGTA 


CATACGCCAT 


10200 




TTTCGTCAGT 


GTCATCCCAG 


TTTTTCATAA 


ATATGCCAAT 


GACATCATAA 


CCTTGTTCTT 


10260 




TTAAGACGTG 


GGCTGTTACA 


GAACTATCTA 


CACCGCCTGA 


CATACCAACG 


ACAACACGTA 


10320 


10 


TATCTTTATT 


TGACAATTAT 


GACTCCTCCT 


TAAATTTAAA 


ATATATTTTA 


TGAATTTCAG 


10380 


- 


CTACAATTGC 


ATTAATTTCA 


TTTTCAGTAG 


TCAATTCGTT 


AAAACTAAAT 


CGAATCGAAT 


10440 




GATTTGATCG CTCCTCATCT TCGAACATTG CATCTAAAAC 


ATGCGACGGT 


TGTGTAGAGC 


10500 


15 


CTGCTGTACA 


TGCAGATCCA 


GACGACACAT 


AGATTTGTGC 


CATATCCAAC 


AATGTTAACA 


10560 




TCGTTTCAAC 


TTCAACAAAC 


GGAAAATATA GATTTACAAT 


ATGGCCTGTA 


GCATCCGTCA 


10620 


20 


TTGAACCATT 


TAATTCAAAT 


GGAATCGCTC 


TTTCTTGTAA 


TTTAACTAAA 


AATTGTTCTT 


10680 


TTAAATTCAT 


TAAATGAATA 


TTGTTATCGT 


CTCGATTCTT 


TTCTGCTAAT 


TGTAATGCTT 


10740 




TAGCCATCCC 


AACAATTTGC 


GCAAGATTTT 


CAGTGCCTGC 


ACGGCGTTTC 


AATTCTTGTT 


10800. 


25 


CACCGCCAAG 


TTGAGGATAA 


TCTAGTGTAA 


CATGGTCTTT 


AACTAGTAAT 


GCACCGACAC 


10860 




CTTTTGGTCC 


GCCAAACTTA 


TGAGCAGTAA 


TACTCATTGC 


GTCGATCTCA 


AATTCGTCAA 


10920 




ACTTAACATC AAGATGTCCA ATTGCTTGAA CCGCATCAAC 


ATGGAAATAT 


GCATTTGTCT 


10980 


30 


CAGCAATAAT 


ATCTTGAATA 


TCATAAATTT 


GT t GCACTGT GCCAaCTTCA TTATTTACAA 


11040 




ACATraTAGa 


TACTAAAATC 


GTCTTATCTG 


tAATTGTTTC 


TTCAAGTTGA 


TCTAAATCAA 


11100 




TAGCACCTGT 


ATCATCAACA TCTAGATATG 


TTACATCAAA 


ACCTTCTCGC 


TCTAATTGTT 


11160 


35 


CAAAAACATG 


TAACACAGAA 


TGATGTTCAA 


TCTTCGATGT 


GATAATGTGA 


TTACCCAATT 


11220 




GTTC2LTTTGC 


TTTTACTATG 


CCTTTAATTG 


CCGTATTATT 


CGATTCTGTT 


GCGCCACTCG 


11280 




TAAATATAAT 


TTCATGTGTA 


TCTGCACCAA 


GTAATTGTGC 


. AATTTGACGT 


CTTGACTCAT 


11340 


40 


CTAAATATTT 


ACGCGCATCT 


CTTCCCTTAG 


CATGTATTGA 


TGATGGATTA 


CCATAATGCG 


11400 




AATTGTAAAT 


CGTCATCATC 


GCATCTACTA 


CTTCAGGTTT 


TACTGGTGTG 


GTCGCAGCAT 


11460 


45 


AATCTGCATA 


AATTTCCATG 


TTTGGACACT 


CCTCACAATT 


TTATCAATGT 


TCCAATAATA 


11520 


GCACCTTACA 


TACTATTTTT 


CTACTTTTCT 


GTTTAACTTT 


ATTTATAATG 


rrrrrAATTA 


11580 




TATTTTACCA 


TTTTCTACAC 


ATGCTTTTCG 


ATAGGCTTTT 


TTAAGTTTAT 


CGCTTTATTC 


11640 


50 


TTGTCTTTTT 


TATAAATTTT 


AGTATTTGCA 


GATATTTTTT 


TATTTGTAAA 


ATGTAACGTA 


'. 11700 




CTATTATTTT 


GGTTATGAGC 


AATTTAATAT 


TTATCTGGTT 


ATTCGATTGG 


TATACTTCTT 


11760 
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GTCCCTATTC GAGAAGGTGA AGATGAACAA ACAGCAATTA ATAATATGGT TAATCTCGCA 11880 

CAACATTTAG ACGAATTATC ATATGAAAGA TATTGGATTG CTGAACACCA TAACGCTCCC 11940 

S AACCTAGTAA GTTCAGCAAC TGCTTTATTA ATTCAACATA CGTTAGAACA TACGAAACAC 12000 

ATACGTGTAG GTTCTGGAGG CATCATGTTA CCTAATCATG CTCCATTAAT CGTTGCGGAA 12060 

CAATTTGGCA CGATGGCAAC ATTATTTCCA AATCGTGTCG ATTTAGGATT AGGACGTGCA 12120 

10 CCTGGAACAG ATATGATGAC CGcAAGTGCA TTAAGACGAG ATCAACATGA TGGTGTTTAT 12180 

AAATTTCCAG AAGAGGTTTC ATTATTACAA CAATATTTCG GCCCTGCTCA CCAACAAGCA 12240 

TATGTTCGTG CTTATCCAGC AGTAGGTAAA AATGTGCCTT TATACATTCT TGGTTCTTCA 12300 

15 

ACAGATTCTG CACATTTAGC TGCTCGCAAA GGGCTTCCAT ATGTGTTCGC TGGACATTTT 12360 

GCACCTCAAC AAATGAAAGA AGCTATCGAA ATTTACAAAA CGTTATTTGA AGCTTCTGAT 12420 

GTATTAGACG AACCTTATGT TATTGTATGT TTAAATACAA TCGTTGCTGA AAATGATGAC 12480 

20 

GAAGCACAAT ATTTAGCTTC ATCTATGGCA CAAGTAATGG TTAGTATCAC TCGTGGCAGA 12540 

ATGCAGCCCG TTCAACCGCC AACACATGAA CTACAAAATA TATTAACGCC GAGAGAATAC 12600 

25 GCGATGGCTA TGGAAAGACA GAAAATATCA TTAATAGGTT CAGAAAATAC TGTTCAACAA 12660 

AAAATTCAAG ATTTTATGGA AACTTATGGT GAAGTCAACG AAATTATGGC AATAAGTTAT 12720 

ATTTATGATA AAGATATGCA ATTAGACTCT TATCGTCGGT TCAAGAATGT TATAAATCAG 12780 

30 ATAAATGAAA AAAACACTTT ATAATGTGAT AAATAAACTA AGTGAAAGTA TGTATCCATA 12840 

ATATTAATAA AAATATACAG TAACAGCATT TTGAATGAAA GATGTCTTTA TTGTTCAATC 12900 

ATTTATTTTA GTAATGATTC AAATTCACTT AAAATyCTAA tGCAAATATG AAAGCGCCCC 12960 

35 TTCAcTTTAC ACTGTGTAAG TGTTTATTTG ATGGGGCGCT TTCAAAATAT TGAAAAGCAT 13020 

ATCCSAAATT TAAAGAAATT TATTTCTCTT TATCTTCATT TTCTTTTTTC TCTTCGTTAT 13080 

TCGAtCCTGT AT ATT CATTT AT CTT AT CTT TTACATTTTT AACTTGTTCA TTATCGCTAT 1314 0 

40 

TTTTAAATTT TTCTACGCGT CTTTAGCTTT ATCCATAAAA CTCATATTAA TCGCTCCTCT 13200 

TATATTTGAT TAGTTTAATT GAACTTATTT TTTAAGTTTA TCAATTGCAT CAGTTATTTT 13260 

GTTTTTAGCA TTTTCAACAA CTTCTTTTGC TTTaCCAGTC GCTTTATCTT GCTGACCTTC 13320 

45 

TTTTTCTAAT TCTTTGTTAT CAGTAACGTT ACCTACTGTT TCTTTAACAT TTCCTTTAAA 13380 

TTGATCGAAC TtACTTTCGT CTGCCATAGT GAAACCTCCT TGGATGTATA TATTTATATA 13440 

50 CCACTAAGGA GGTTCGCTmm mCAyymyAAT ATGAAGTTTT TATGTTATAG TATAGTATTT 13500 

ATACGATTAA ATATAAAACA TGTATCCGTC TAAATCTTCA CTTGTATCTA CATATTCCGC 13560 
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TAGTTGTTTT 


TGCGCAGGTG GTTCTGATTC AATACTTTCA 


ACAAATGTAA 


TTGGACCTTC 


13680 




TAACAGTCTT 


ATAATATCCC CTGCTGAGAT TTCTT * 






13715 


5 


(2) INFORMATION FOR SEQ ID NO: 196: 








10 


(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 873 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 








15 


(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 196: 






AAATCCATAA 


TGTCATGATA ATCTGCATAT GCTTCATATA 


A 1 1CAA1 <-A I 




o u 




GGGTTATGTC 


TAGTTGATAC ACCTTCATTA CGGAATA^lv, 




ATATACTTTT 


ion 


20 


TCAAGTCCAC 


CGACAATTAm ACGTTTTAAA TGCAACyCAA 


TAGCAATACG 


CAILj 1 A lAaL 


1 QA 

xou 




GTTGCATCTA 


ATGCATTATG ATGTGTTACA AATGGTCTAG 


CAGCTGCTCC 


ACCAGCAATT 






TGGTGCATCA 


TAGGTGTTTC TACTTCCAAG AAACCTTTAT 


TATTTAAATA 


ATTACGCATT 


inn 


25 


TCTTGAATGA 


TTTTACTACG ATTAATAAAT GTACGAGTGC 


TATCTTCGTT 


CGTAATTAAA 


urn 




TCTAAATATC 


TTTGACGATA tCTCTGTTCA ATATC CTGTA 


AACCGTGGAA 


TTTATCCGGT 


420 




AATGGTCGCA 


ATGATTTAGT TAGTAGCGTG AATTTCTTCG 


CTTTAACCGA 


TAATTCGCCA 


a q n 


30 


GTATTTGTTT 


TGAACATTAC ACCTTCAACA CCAACGATAT 


CGCCTAAATC 


AGCA'iTlTiC 






CATAAATCAA 


ATTCGTCATC GCCAACTTGA TCTTTACGAA 


CGTAAATTTG 




600 




GCTAAGTCCT 


GAACGTGTGC AAATCCTGCT TTACCTTTAC 


CACGCTTAGT " 


CATTAATCGT 


660 


35 


CCAGCTATAG 


CGACATGACT ATCCG CTTCT TTTTCTACCA 


ATTCTTCTTT 


AGAATACTGG 


720 




TCCeACTCTT 


CTTTCAAATC ACTAGATAAA CCTGAACGGT 


CAAATTTAGA 


ACCAAACGGG 


780 


40 


TCTATACCAA 


GATCATATAA TTCTTGTAAT TtTTGACGTC 


GAACCAACAT 


TTGGTCATTC 


840 


ATTTCTTCTG 


ACATAACTtT CTCTCCTTTA ACT 






873 



(2) INFORMATION FOR SEQ ID NO: 197: 

(i) SEQUENCE CHARACTERISTICS: 
45 (A) LENGTH: 452 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

50 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 197: 
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ACCATAATAT GAATGOCTTC AGGATCAAAA TAAAGACCAA CTTCACTGCC TACTTCAGCT 120 

TTTTTAGTCG TTTGTATTAC CCATTCATAA CCTTTATTGT CTATACAACA TATTTCATAG 180 

TCGACCCCTC TAAATAACAT AGAATCAACA GTTGCTTTAA ATAATCCTTC TTCAGCTTTG 240 

ATTAATGATA TATCTTCTGG TCGAATAACG ACTTCTACTT TTTTATTTTC AGGAATACCC 300 

ATATCGACAC ATTCGAAATC TTGCCCATAA ATATTCACGA CATAATCTCT AACCATGCGC 360 

CCTTCAACAA TATTAGATTC TCCAATAAAA TCAGCTACAA ATCGATT CAC TGGTTCGTCA 420 

TaTATATCTG TTGGTGTGCC AAATTGTTGA AT 4 52 



(2) INFORMATION FOR SEQ ID NO: 198: 

15 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2308 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 198: 



25 



30 



35 



40 



45 



50 



TAGGTTGGGT 


TCTAACATAC GATAAAGCTC 


AACAAATCAA 


CACAGCTTTC 


TTTGTAAAAT 


60 


TGTTTAATAC 


TGCATTAGCA 


GAACGTGATT 


ATTATTTTAA 


TATAGATGGA 


ACAAATGCTT 


120 


TTAGATT ATT 


TAATGCTGAA 


GGTGATGGTG 


TTGGGGGATT 


AACAATCGAC 


AATTACGATG 


180 


GTCATTTGTT 


GATTCAATGG 


TACTCAAAAG 


GTATTTATAA 


ATTTAAATAT 


GCCATTCTTG 


240 


AAG CGGTT AG 


AAAAGTATTT 


GATTATAAAT 


CTATTTACGA 


AAAAGTAAGA 


TTTAAAGACA 


300 


GCGAATATAG 


TGGTGGTTTT 


GTTGAAGGAG 


ATGCACCTGa 


GTTTCCAATT 


GTTATCGAAG 


360 


AAAACTTCAC 


ATTTTATAAT 


GTAGAC CTTG 


AAGATGGTTT 


GATGACAGGT 


ATcrrriTAG 


420 


ATCJ&AAAGA 


AGTGCGCAAG 


AaATTAAGGG 


ATCAATATGC 


CAAAGAACGC 


CATGTTTTAA 


4B0 


ACTTATTTAG 


TTATACAGGT 


GCTTTTTCTG 


CAATAGCAGC 


AAGTGAGGCA 


TCTTCAACAA 


540 


CAAGTGTAGA 


TTTGGCTAAT 


CGTTCTCGTA 


GTTTAACTGA 


AGAAAATTTT 


GGATTAAATG 


600 


CTATTGATCC 


TAAATCCCAA 


TATATTTATG 


TCATGGACAC 


TTTTGATTTC 


TATAAATATG 


660 


CTGCACGACA 


TGGACATAGT 


TATGACACGA 


TCGTGATTGA 


TCCACCTAGC 


TTTGCGCGTA 


720 


ACAAAAAACG 


TACATTTTCA 


GTGCAAAAAG 


ATTATGACAA 


ATTAATTAAT 


GGCGCCTTAA 


780 


ATATCTTATC 


ATCTGAAGGA 


ACATTATTGT 


TATGTACAAA 


CGCAAGTGTA 


TATCCATTAA 


840 


AGCAATTTAA 


AAATACTATT 


AAAAAGACGC 


TTGAAGAGAG 


TGGCGTTGAT 


TATGAATTAA 


900 


CTGAAGTTAT 


GGGATTACCA 


AAAGATTTTA 


AAACG CATCC 


• ACATT AT AAG 


CCATCTAAAT 


960 
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1 TATTGAGAAA AAGAAGGGTG ATAATATTAT GGGATTCAAA AACAATTTAA CATCAAATTT 1080 

AACAAATAAA ATCGGTAATT CAGTCTTTAA AATAGAAAAT GTTGACGGAA AAGGTGCAAT 114 0 

5 GCCAACGACG ATTCAAGAAT TGAGAGAAAG ACGACAACGT GCTGAAGCAA TTGTAAAGAG 1200 

AAAGTCTTTA ATGTCATCAA CAATGAGCGT TGTTCCAATT CCGGGTTTAG ATTTTGGTGT 1260 

TGATTTAAAA TTAATGAAAG ATATTATCGA AGATGTTAAT AAAATTTATG GTTTAGATCA 1320 

10 

TAAGCAAGTT AATAGCCTTG GGGATGATGT GAAAGAAAGA ATTATGTCTG CAGCAGCAAT 1380 

TCAAGGTAGT CAATTTATTG GTAAAAGAAT TTCAAATGCA TTTTTAAAAA TTGTAATTAG 1440 

AGATGTAGCT AAACGTACTG CTGCAAAACa AACAAAATGG TTTCCTGTTG TAGGACAAGC 1500 

15 

TGTGTCTGCA TCTATT AGTT ACTATTTTAT GAATAAAATT GGAAAAGATC ACATTCAAAA 1560 

ATGCGAAAAT GTTATTAAAA ATGTCATGTA GGTGCTATAA TAGTTTTGCA ATTTGCAAAT 1620 

2Q TTTACTGAAA CCGGTTTTAA ACGAATTGAA TTTAAAGcAT GGTTTTGGTA AAGTTAATGT 1680 

ATAAAACTAA GTTAGyATTG TAATAATATk GAAGATTCTA ACTATACGAA GGAGAAATGT 1740 

AATTATGGAA CAAAATTCAT ATGTAATCAT CGACGAGAmT GGTATTCACG CTAGACCAGC 1800 

25 AACAATGTTA GTACAAACAG CTTCAAAATT CGATTCTGAT ATTCAATTAG AATATAACGG 1860 

TAAGAAAGTA AACTTAAAAT CAATCATGGG TGTTATGAGC CTTGGTGTTG GTAAAGATGC 1920 

TGAAATT ACA ATTTATGCTG ACGGTAGTGA TGAATCTGAC GCCATTCAAG CAATCAGTGA 1980 

30 CGTCTTATCA AAAGAAGGAT TGACTAAATA ATCATGTCTA AATTAATTAA AGGTATTGCC - 2040 

GCATCTGATG GTGTCGCAAT TGCTAAAGCT TATTTATTAG TTGAGCCAGA CTTAACATTC 2100 

GACAAAAATG AAAAAGTCAC TGATGTTGAA GGAGAAGTTG CAAAGTTCAA TAGCGCTATC 2160 

35 

GAAGCTTCTA AAGTTGAGTT AACTAAAATT AGAAATAATG CAGAGGTTCA ACTAGGTGCT . 2220 

GATAAAGCTG CTATCTTTGA TGCAcaTTGG GGGGTGGTAG ATGACCCTGA ATTAATTCAA 2280 

CCAATCCAAG ATAAGATTAA AAATGAAA 2308 

40 

(2) INFORMATION FOR SEQ ID NO: 199: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5559 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

50 <xi) SEQUENCE DESCRIPTION: SEQ ID NO: 199: 

AAGTAATAAA TCGTCTCATT TGGCAACTGA CGCATAATTT CTTTAGCTAC TGTCAAACCT • 60 
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10 



15 



20 



25 



30 



35 



40 



45 



SO 



TTTAATTTTT AGTTTATCAT AACTAAGCAT 
ATTTTTGTCA TTATAATATT TATTTTAAAT 
CTTATTAAAA AAATCCCTTC CAAGTTATTG 
AACATAAGwT TTTAACTCAA AAGGGATTAA 
GAATGATTTA AACATGTGGA ATGTTGTTTC 
TGGAATACCT TTAGGGCAAG CATTAACACA 
ACCAGTACCC ATTAATGCAT TTAAACGTTC 
ATTAAACAAA CGAACTTGGG AGATTGCTTG 
ATTAGGACAA ACCTCTAAAC ATACACCACA 
TTGACGTTTT TTCTCTGGCA TACGTGGTCC 
GATCCATGCT TTCATACGTT TTAAGTTATC 
ACGGATAACT GGGAAAGTAT TCATTGGCTC 
AATCGCAGAA CAAGATTGTC TTGCACGACC 
TTCTTCTAAG CAGTTCATAT CCCAGACAAC 
TGGGTTACGT CTAATTTCCA TTAAACAAGC 
TTCAAATGTT TCTTCATAAG GCTTAGAATC 
TACTGTTTTT TGTTTCGGTT TAGATTGTGT 
TTCAGTCATT ATTTTTTACC CCCTTTAGAC 
ATTAAACTCA CATCGACGTG ATCATAAGTA 
GAGGGGATTG TCGTTTTTAA CCACTCTTCA 
TGGGCACCGC GTGATTCGTT ACGGTTATAT 
AACATGTTCC atagttgacg GGTAAAGAAT 
TCCATATCAA TATCTTCATA ACGTTTCATC 
AGTTTTTCAT TTTCACGAAG AACAGTTACA 
TGTAATTTAT ATGCATTTTC TGTACCGCGC 
TC^CAGCTT f ACGCTTTTC AAAAATACTT 
TTTGAAATAT AATCAATCGC GTTTGGACCT 
AATGAATTGG CACGTAAGCG GTTACCACCA 
AATAACCCTT TAATATTTGT CATTTGATCA 



TGGATTTTAG TATTATGCAC TGTGTTTACC 130 

CAGCCCACTA TCATATTGTC ATGTAATCTG 240 

TGTAfCTCCA TTCAATTTAA TTTTGAAAGG 3 00 

TTTnTAnTCT ACTTCATGGT CTGAACCAAA 3 60 

TCTGTTCATT GCTGCAATGG ATGTTGTTAA 420 

GTTTTGTGAA TTACCACACT GCTGTAAGCC 480 

AT CTTTAGTC ATAGATCCTG TTGGGTGCAA 540 

TGCACCAACG AaTTTATTAT TTTCAGTAAC 600 

TGTCATACAT TTAGATAATT CATAAGCTGT 660 

CGGACCTAAA TCATACGTTC CATCAATTGG 720 

GAACATTCTA GAACGATCAA CTTGTAAGTC 780 

TAAACGAATA GGTTGTTCTA ATTGATCAAC 840 

ATTGATAACC ATAGAACATG CTCCACATAC 900 

AGGTGTTGTT TTTTCACCTT TAATATTAAC 960 

AATGACGTTT AAATTTTCAC GATATGGAAT 1020 
ACTTGTATCT TGTCGTTTAA TAATTAATTT ' 1080 
TTCATGTTGT GGAGTGTTTT TCACTGATTG • 1140 

TTACTTGTGT AATCACGTTT ACGAGGTGGT 1200 

AACTGCGGTT TTTCAAATGC GCCTTGGAAT 12 SO ' 

TCATTACGCT CTGGGAATTC TGGTTTATAA 1320 

GCACCAATCG TAATAACACG TGCAAGTACT 1380 

ACCGCTTGGT TACTCCAAGT TTGAGTATCT 1440 

AATTCAACAA TCTTTTTATC TGTTTCTAAC 1500 

TTTGCTGTCA TAATTTCACC AAGTTCACGG 1560 

ATAGCTAATA ATTTATCAAA ACGTTCTTGC 1620 

TCGTCCATAT CAGTATATGA TGGATGAATA 1680 

GCTACTGTAC CACCATAAAT CGCTGATAAC 1740 

TGTTGAGAGA AGTCACATTC TCCAGCTGCA 1800 

TAATCTACAT ATAGACCACC GATTGAATAG 1860 
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TAAATCTCAA 


TGATACCACC 


TAGTTTTACA TCTAACTCAT GTGGATCTTT 


ATGTGACAAA 






TCAAGATATA 


CCATGTTTTC 


GCCATTTATA CCTAATTTTT 


GGTTAATACA 


TACATCGAAA 


2040 


5 


ATTTCACGCG 


TTGCGATATC 


ACGAGGTACT 


AAGTTAC CAT 


AATCAGGATA 


TTTCTCTTCT 


2100. 




AAGAAGTACC 


AAGGCTTACC 


ATCTTTATAT 


GTCCAAATTG 


. GTCCACCTTC 


ACCACGTGCT 


2160 




GATTCACTCA 


TTAGTCGCAG 


TTTATCATCA 


CCAGGGATTG 


CAGTAGGATG 


AATTTGAATG 


2220 


10 


AACTCACCAT 


TAGCATAAAT 


AGCGCCTTGT 


TGGTAAACAA 


TGGAAGCCGC 


TGATCCTGTA 


2280 




TTAATCATTG 


AGTTTGTTGT 


TTTACCGAAA 


ATAATACCAG 


GGCCACCCGT 


TGCCATAATA 


2340 


15 


ACTGCATCTG 


AACCAAATGT 


TTCAATCTCA 


GCAGTTGTCA 


TATTTTGTGC 


An CG ATACCT 


2400 


CTTGCACTAT 


CATCGTCACC 


TTTAACTATG 


CCAAGGAATT 


CCCATCCTTC 


ATACTTCGTA 


2460 




ACTAATCCAT 


CTACTTCATA 


TGCACGAACT 


TGTTCATCCA 


ATGCATATAA 


TAATTGTTGT 


2520 


20 


CCAGTTGTTG 


CCCCTGCATA 


TGCTGTTCTG 


TGATGTAATG 


TACCACCGAA 


ACGTCTAAAA 


2580 




TCTAATAGAC 


CTTCATTTGT 


TCTATTGAAC 


ATTACGCCCA 


TACGGTCTAA 


TAAATGAATA 


2640 




ATTTTAGGTG 


CTGCCTCTGT 


CATCGCTTTA 


ACAGGTGGTT 


GGTTTGCAAG 


GAAATCGCCA 


2700 


25 


CCATACACTG 


TATCATCAAA 


GTGAATCCAA 


GGAGAATCGC 


CTTCCCCTTT 


AGTATTGACC 


2760 




GCACCATTAA 


TGCCACCTTG 


GGCACAAACA 


GAGTGCGAAC 


GCTTTACTGG 


TACAACTGAG 


2620 




AACAAATCTA 


CATGTGCACC 


TTTTTCTGCC 


GCTTTAATTG 


TTGACATTAA 


GCCCGCTAGG 


2880 


30 


CCACCTCCGA 


CAACAATAAG 


ATGTTTCTCT 


GCCATAAAAA ,TTTCACTCCC - CTAAATTTTC 


2940 




AATCTATATT 


TGTTAAATGC 


GATGTATTAC 


ATAAAGGCAA 


TAATTGCAGT AACACCAATA 


3000 




TACGAAATAA 


CTAAAAATAC 


GATTAATGAA 


ACCCATGTAA 4 ATACTCGTTG 


TGATTTTGGA 


3060 


35 


. GATTGAAGTC 


CACCCCAAGT . 


AACTAAGAAT 


GACCATAAGC , 


CATTTGCAAA 


GTGGAAGACA ; 


3120 




ACAGCAATAA 


TACAAATAAT 


ATAAAATATT 


GGCCATCCAG 


GATGTTGCAA 


TGTTTCGTGC 


3180 




ATTAAATCGT 


AATTCACTTC 


TTTGCCGTAA 


AATGCTTTTT 


GTAAACGTGT 


TTGCCATAAA • 


3240 


40 


- TGGATACCAA 


TAAAGATAAA 


TGTTAAGATA 


CCACTCACTC 


TTTGGAAGAA 


GAACATCCAG 


3300 




TTTCTAAAAA 


TCGAGTAATG 


TCCAACATTT 


TCTTTTGCTG 


TAAATGCAAT 


GTGTATACCA 


3360 


45 


AACAAACCGT 


GATATAACAA 


CGGAATGTAT 


ATAAATAAAA 


ATTCTACAAT 


AATTAGAAAT 


3420 


GGTAATGATT 


CCATAAAGTT 


AGATGCCTTA 


TTAAACGCTT 


CAGCACCTTG 


TGTTGCTTGG 


3480 




TGATTCACTA 


ATAAATGAAC 


GACCAAAAAT 


GCACCTATTG 


GGATAATACC 


TAATAACGAG 


3540 


SO 


TGAATACGTC 


TTAGATAAAA 


TTCATTTTTT 


GATTGAGCCA 


AAAGGAGTCC 


CCCCTGTGAA . 


3600 




CGAATATTTA ATTTATTGAG 


CTATTTATAT 


TAAACGTACG 


CTTAACCCCC 


TAAAGTGATA 


3660 
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CGATCACCAA ACTGCATGTC GAACAATGTA ACATTTGGAT TCGATATTTA AAATTGCTTG 3780 

TGATGATAAA CTTTCTCATT TAGAAAACGC TTCCACGTAC ATTCAAAAAA ATAACTTTGT 3840 

5 TAACCATATT GTAACATTAT TTCATATAtT TTGGGGCATG AGAATGATTC TCACGCCGAG 3900 

TAATTTATTT ATGCAATTGT TCATGTAGGT TCTTTGCGAC GTTTTCAGGA ATACCTATAT 3 960 

TTTTAAAATC TTCAAGTGTA GCTTCCTTCA TTTTCTTGAT TGAACCGAAT GAACGCAATA 4020 

10 ATAATGTTTT AGGTTTGTTA CCGATACCAT CTATATCATC AAGTATTGAT TTCAAGCCTG 4080 

TCTTTTGACG TGTTTGTCTA TGAAATGTGA TTGCGAATCT GTGAACCTCA TCTTGGATAC 4140 

GGTGCAACAA ATAAAATGCC TGGCTATTTT TCTTCAGTGG TACAATTTCT GCACTAGCGC 4200 

15 

CATATAATAA TTCAGATGTT TGGTGTTTAT CATTTTTCTG CAAACGTGCA AGAGGGATAT 4260 

CAAGACCTAA TTCGTTTTGT AGCACATCAA TAACCCCGTT CATATGTCCT TTACCACCAT 4320 

CTACTATTAT TAAATCAGGT AATGGTAATC CTTCGTTTAA AACGCGAGAA TATCGTCGTC 4380 

20 

TTACTACTTC TCTCATTGAT TTGTAATCAT CTGGACCTTT AACCGTTTTG ATTTTATACT 4440 

TTCTATAATT TTTCTTATCT GGTTTACCGT CGACAAATGT AACCATTGCT GACACTGGAT 4500 

2S CCACACCTTG AATATTAGAA TTATCGAATG CTTCAATTCT AATTGGTGTT TGAATTCCCA 4560 

TTTGTGTTCC AAGTTCTTCA ATAGCTTTAA TCGTTCTGGA CTCATCACGT GATATTAATT 4620 

CAAATTTATT ATTTAAGGAT ACTTTAGCGT TATGTGCAGC TAGGTCAACC ATATCTTTTT 4680 

30 TGGGACCTCG CGCGGGTTGA ACGATTTTAG TGTCCACAAC AGATTGAATC ATTTCTTTAT 4 740 

CCAAATTACG TGGTACATGA ACTTCCTTAG GTAAAATATG TTGGTTTAAG CTATAAAATT 4 800 

GTCCAATAAA TGTATAAAAT TCTTCTTcTT CTGTTTGCTG TAATGGAATC ATCGTTGTAT 4 860 

35 CTCGCTTTAT CATATTACCT TGTCGTATAA AGAAAACTTG GATACACATC CATCCTTTAT - 4 920 

CAACACTATA ACCAAAGACA TCACGAATCG TTTTATCTGA TGACATAATT TTTTGTTTGT 4 980 

TTGTCAGATT TTGAATATGT TGAATTAAAT CTCTATATTC TTTAGCCCGT TCAAAATCAA 504 0 

40 

GTGATTCACT TGCAGTTAAC ATTCGCTCTT CTAAACTTTT TAAAATTGTT TTGTCTTGGC 5100 

CATTCAGAAA ATCAGTAATT TCCTTCGTCA TTTGTGCGTA TTTACTCAAA TCAACGTCAT 5160 

/ • ...... 

ATACACATGG TCCTAAACAT TGTCCAATAT GGTAATAAAG ACATAATTTA TCTGGCATCT 5220 

45 

TATCACATTT GCGATATGGA TATATTCTGT CTAATAACTT TTTAGTTTCT TGAGCAGAAT 52 80 

ATG CATTCGG ATACGGTCCG AAATATTTGC CAGTACCTTG TTTTACAGTT CTCGTCACTA 5340 

£0 GTAGTCTAGG ATATTTCTCC TTCGTAATTT TAATAAATGG ATAACTTTTA TCATCCTTTA 5400 

ATAATATATT ATATCTTGGT TGATATTGTT TAATCAGATT CAATTCCAGT AAAAGTGATT 5460 
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10 



15 



20 



25 



30 



35 



40 



45 



SO 



TTTTAGCATC ATGAGCACCC GTAAAATATG ATCGCAATC 
(2) INFORMATION FOR SEQ ID NO: 200: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4594 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double : 
(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 200: 
AAATCAATCG AGTGGCATGT CAAGGTCATA TCAATATTTT AGAATCTGCG 
AGGAAATAAA TGAAATTGCG CGACGTATCA TCGTTGATAT TCGTGATAAG 
ATCAAGATAT TGCTATTTTA TATCGTGATG AATCTTATGC TTATTTATTT 
TACCGCTTTA TAATATTCCT TATAATATTG ATACAAAGCG TTCGATGACA 
TCATGGAAAT GATTCGTTCA TTGATTGAAG TTATTCAATC TAATTGGCAA 
TGCTACGCTT ATTGAAGACT GATGTGTTAA CGGCATCATA TCTAAAAAGT 
TTGATTTACT TGAAAATTTT GT ACTTGAAC GTGGTATAT A CGGTAAACGT 
ATGAGCTATT TAATGTCGAA CATTTTAGCA AAATGGGGCG TAAAGCGCAT 
AAGATGAACG TAACACATTT GAACAAGTCG TTAAGTTAAA GAAAGATGTC 
TTTTACATTT TGAAAAGCAA ATGTCACAAG CGGAAACTGT AAAAGATTTT 
TTTATGAAAG TATGGAATAT TTCGAACTGC CAAATCAATT GATGACAGAG 
TTGATTTAAA TGGTAATCAT GAAAAGGCGG AGGAAATTGA TCAAATATGG 
TTCAAATCCT TGATGACTTA GTTCTAGTAT TTGGAGATGA ACCAATGTCG 
TCTTOGAAGT ATTTGATATT GGTTTAGAAC AATTAGAATT TGTTATGATT 
TGGACCAAGT AAGTATTGGT ACGATGGATT TGGCTAAAGT CGATAATAAG 
ACTTAGTAGG TATGAATGAT GGAACGATGC CACAACCAGT AmTGCGTCAA 
AGATGAAGAA AAGAAATACT TTGAACAGCA GGCTAATGTC GAGTTAAGTC 
TATTTTACAG ATGGATGAAG CATTTGTTTG TTATGTTGCT ATGACTAGAG 
TGTTACATTT TCTTACAGTC TAATGGGATC AAGTGGTGAT GATAAGGAGA 
TTTAAATCAA ATTCAATCAT TGTTCAACCA ATTGGAAATT ACTAACATTC 
TGAAGTTAAC CCATTGTCAC TAATGCAACA TGCTAAGCAA ACCAAAATTA 
AGCATTGCGT GCTTGGTTAT ATGATGAAAT TGTGG CTGAT AGTTGGTTAG 



5559 



ACTATGAGAG 
CAATTACGAT 
GATTCCATAT 
CATCATCCGG 
GTGAATCCAA 
GCATACTTAG 
TGGTTAGATG 
AAACTGACCG . 
ATTGATAAAA 
GCAACTGCTT 
CGAGATGAAC 
AATGGCTTAA 
ATGGAACGTT 
CCGCAAACAT 
CAACATGTTT 
GCTTGATTAC 
CAACATCAGA 
CTAAGGGAGA 
TCAGCCCATT 
CTCAATACCA 
CATTATTTGA 
ATGCTTATCA 



60 
120 
180 

240 

v 

300 
360 
420 
480 
540 
600 
660 
720 
. 780 
* 840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
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GTTTGACAAT GAAACTGTAA AATTAGGTGA AACGTTGTCT AAAGATTTAT ATGGTAAGGA 1440 

AATCAATGCC AGTGTATCCC GTTTTGAAGG TTATCAACAA TGCCCATTTA AACACTATGC 1500 

5 GTCACATGGT CTGAAACTAA ATGAGCGAAC GAAGTATGAA CTTCAAAACT TTGATTTAGG 1560 

TGATATTTTC CATTCTGTTT TAAAATATAT ATCTGAACGT ATTAATGGCG ATTTTAAACA 1620 

ATTAGACCTG AAAAAAATAA GACAATTAAC GAATGAAGCA TTGGAAGAAA TTTTACCTAA 1680 

10 

AGTTCAGTTT AATTTATTAA ATTCTTCAGC TTACTATCGT TATTTATCAA GACGCATTGG 1740 

CGCTATTGTA GAAACAACAC TAAGCGCATT AAAATATCAA GGCACGTATT CAAAGTTTAT 1800 

GCCAAAACAT TTTGAGACAA GTTTTAGAAG GAAACCAAGA ACAAATGACG AATTAATTGC 1860 

15 

ACAAACATTA ACGACAACTC AAGGTATTCC AATTAATATT AGAGGGCAAA TTGACCGTAT 1920 

CGATACGTAT ACAAAGAATG AT ACAAGTTT TGTTAATATC ATTGACTATA AATCCTCTGA 1980 

2Q AGGTAGTGCG ACACTTGATT TAACGAAAGT ATATTATGGT ATGCAAATGC AAATGATGAC 2040 

ATACATGGAT ATCGTTTTAC AAAATAAACA ACGCCTTGGA TTAACAGATA TTGTGAAcCA 2100 

GGTGGaTTAT TATACTTCCA TGTACATGAA CCTAGAATTA AATTTAAATC ATGGTCTGAT 2160 

25 ATTGATGAAG ATAAACTAGA ACAAGATTTA ATTAAAAAGT TTAAGTTGAG TGGTTTAGTT 2220 

AATGCAGACC AAACTGTTAT TGATGCATTG GATATTCGTT TAGAACCTAA ATT CACTTCA 2280 

GATATTGTAC CAGTTGGTTT GAATAAAGAT GGCTCTTTGA GTAAACGAGG CAGCCAAGTG 2340 

30 GCAGATGAAG CAACGATTTA TAAATTCATC CAACATAACA AAGAGAATTT TATAGAAACA 2400 

GCTTCAAATA TTATGGATGG ACATACTGAA GTTGCACCAT TAAAGTACAA ACAAAAATTG 2460 

CCATGTGCTT TTTGTAGTTA TCAATCGGTA TGTCATGTAG ATGGCATGAT TGATAGTAAG 2520 

35 

CGATATCGAA CTGTAGATGA AACAATAAAT CCAATTGAAG CAATTCAAAA TATTAACATT 2580 

AATGATGAAT TTGGGGGTGA GCAATAGATG ACAATTCCAG AGAAACCACA AGGCGTGATT 2640 

TGGACTGACG CGCAATGGCA AAGTATTTAC GCAACTGGAC AAGATGTACT TGTTGCAGCC 2700 

40 

GCGGCAGGTT CAGGTAAAAC AGCTGTACTA GTTGAGCGTA TTATCCAAAA GATTTTACGT 2760 

GATGGCATTG ATGTCGATCG ACTTTTAGTC GTAACGTTTA CAAACTTAAG CGCACGTGAA 2820 

ATGAAGCATC GTGTAGACCA ACGTATTCAA GAGGCATCGA TTGCTGATCC TGCAAATGCA 2880 

45 

CACTTGAAAA AC CAACGCAT CAAAATTCAT CAAGCACAAA TATCTACACT CCATAGTTTT 294 0 

TGCTTGAAAT TAATTCAACA GCATTATGAT GTATTAAATA TTGACCCGAA CTTTAGAACA 3000 

SO AGCAGTGAAG CTGAAAATAT TTTATTATTA GAACAAACGA TAGATGAGGT CATAGAACAA 3060 

CATTACGATA TCCTTGATCC TGCTTTTATT GAATTAACAG AGCAATTGTC TTCAGATAGA 3120 
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AATCCTACAA 


ATTGGTTGGA 


TCAATTGGTG 


ACACCATACG AAGAAGAAGC ACAACAAGCG 


3240 




CAACTTATTC 


AACTACTAAC 


AGACTTATCT 


AAAGTATTTA 


TCACAGCTGC 


TTATGATGCT 


3300 


5 


TTAAATAAGG 


CGTATGATTT 


GTTTAGTATG 


ATGGATAGCG 


TCGATAAACA 


TTTAGCTGTT 


.3360 




ATAGAAGATG 


AACGACGTTT 


AATGGGGCGT 


GTTTTAGAAG 


GTGGCTTTAT 


TGATATACCT 


3420 




TATTTAACTG 


GTCACGAATT 


TGGCGCGCGT 


TTGCCTAATG 


TAACAGCGAA 


AATTAAAGAA 


3480 


10 


GCAAATGAAA 


TGATGGTCGA 


TGCCTTAGAA 


GATGCTAAAC 


TTCAGTATAA 


AAAATATAAA 


.3540 




TCATTAATTG 


ATAAAGTGAA 


GAGTGATTAC 


TTTTCAAGAG 


AAGCTGATGA 


TTTGAAAGCT 


3600 


15 


GATATGGAAC 


AATTGGCGCC 


ACGAGTAAAG 


TACCTTGCGC 


GTATTGTGAA 


AGATGTTATG 


3660 


TCAGAATTCA 


ATCGAAAAAA 


GCGTAGCAAA 


AATATTTTGG 


ATTTTTCTGA 


TTATGAACAT 


3720 




TTTGCATTAC 


AAATTTTAAC 


TAATGAGGAT 


GGTTCGCCTT 


CAGAAATTGC 


CG AATCATAC 


3780 


20 


CGTCAACACT 


TCCAAGAAAT 


ATTGGTCGAT 


GAGTATCAAG 


. ATACGAACCG 


AGTTCAAGAG 


3840 


AAAATACTAT 


CTTGCATCAA 


AACGGGTGAT 


GAACATAATG 


GTAATTTATT 


TATGGTTGGA . 


3900 




GATGTTAAGC 


AATCCATTTA 


TAAATTTAGA 


CAAG CTGATC CAAGTTTATT 


TATTGAAAAG 


3960 


25 


TATCAACGCT 


TTACTATAGA 


TGGAGATGGC 


ACTGGACGTC 


GAATTGATTT 


GTCGCAAAAC 


4020 




TTCCGTTCTC 


GAAAAGAAGT 


ACTGTCAACG 


ACTAACTATA 


TATTCAAACA 


TATGATGGAT 


4080 




GAACAAGTCG 


GTGAAGTAAA 


ATATGATGAA 


GCGGCACAGT 


TGTATTATGG 


TGCACCATAT 


.4140 


30 


GATGAATCGG 


ACCATCCaGT 


AAACTTAAAA 


GTCCTTGTTG 


AAGCGGATCA 


AGAACATAGT 


.4200 




GATTTAACTG 


GTAGTGAACA 


AGAAGCGCAT 


TTTATAGTAG 


AACAAGTTAA 


AGATATCTTA , 


4260 




GAACATCAAA 


AAGTTTATGA 


TATGAAAACA 


GGAAGCTATA 


GAAGTGCGAC , ATACAAGGAT 


. ,4320 


35 


ATCGTTATTC 


TAGAACGCAG 


CTTTGGACAA 


GCTCGCAATT TACAACAAGC 


CTTTAAAAAT. , 


4JoU 




GAACJATATTC 


CATTCCATGT 


GAATAGTCGT 


GAAGGTTACT 


TTGAACAAAC 


AGAAGTCCGC 


4440 




TTAGTATTAT 


CATTTTTAAG 


AGCGATAGAT 


AATCCATTAC 


AAGATATTTA 


TTTAGTTGGG 


4500 


40 


TTAATGOGCT 


CCGTTATATA 


TCAGTTCAAA 


GAAGACGAAT 


TAGCTCAAAT 


TAGAATATTG 


4560 




AGTCCAAATG 


ATGACTACTT 


CTATCAATCG 


ATTG 






4594 



(2) INFORMATION FOR SEQ ID NO: 201: 

45 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 6313 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
„ <D) TOPOLOGY: linear 
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GGTTTTCnTG GAAAGATAGT GAAAATCTCG 
TTTaTAAAAT GGCTTACATA TATGAAGCGT 
5 AC CTATTTAG CTTTAAGAAG GCATAACAAG 

TTATGCGAAG ATTAAGGTGA GTAGTAAATT 
AGTGTTGAAA CAGCACAACG AAAAAGAAAA 

10 

ACAAAGGCAA TCTAACTTTA TTCGGTATGT 
TACAATAAAA GTGGATGATG ATAGCGTTAA 
TTTGCATTTT GTTGAAGGAC AAACGACAAC 

15 

TCCACTAGAA GTTAAAACAT TACX3CATTTT 
AAAGATTCAT TATGAATTAT ATCAAGATAA 

2Q TAACTATAAG GAGATAGGCG AATGAATATT 

GAAATTGCAG CAAGTATTAA CAAAGCAGGA 
GAAGTTCCTA AAGATACAAA AAATGGAGAT 

25 AAGATTGCAA AG CGTAATC C TCGTGAAATT 

GAAAAAGCAC ATGTAAAACA AATTGACATT 
GATAATCAGT ATTTAACAGC AATTATTCCT 

30 CATGTAAATG AATCAAAAGG TCAAAATGTA 

GGAGATTTAC ATATTGGTCA TGCTAGAAAT 

TTAAGTGCAG CTGGCTATAA TGTAACACGT 

35 " .. 

ATTACTAACT TAGCGCGTTC GATTGAAACA 

TATTCAATGC CAGAAGATGG CTATAATGGA 

GCAGAGAAAC ACCCTGAAAT TAAAGATTAT 

40 

AAATTAGGCG TAGAATACGA AATGGCTAAA 
CATTTTGATA ATTGGTTTAG TGAAaCATCT 
TTAGCAAAAA TGAAAGAATT AGGTTATACG 

45 ■ 

ACAACTGATT TTAAAGACGA CAAAGACAGA 
TATTTCTTAC CAGATATTGC GTACCACTTC 
50 ATCGATTTAT TTGGTGCTGA T CATCATGGT 

ACGTTTGGTG TAGATAGTAA TCGTTTAGAA 

55 



TGTTTTTTGG TTTTgAGGTG TTGTTTGTAT 60 
TGATTAAGTA TGGAATTGTT AATTAATTGA 120 
ATGACGTTAT TTTATGCTAT AATATTTCTA 180 
GGATAAAAAA GTAAGTATTC AAACAAAGCA 240 
ATTTGAATTT ACTACTGAAG GAACTTGGCA 3 00 

AGAACAAATT GAGGATGCAA CAGTTAATGT 3 60 

GTTGATTCGT AAAGGCGACA TTAATATGAA 420 
AACTTTTTAC GATATATCGG CTGGACGAAT 480 
ACATTTCGTA AGTGGAGACG GTGGCAAGCT 540 
TGAAAAAATG GGTTCTTATC AATATGAAAT 600 
ATTGATCAAG TGAAACAAAC ATTAGTAGAA 660 
TTAGCAGATG AGATTCCTGA TATTAAAATT 720 
TATGCTACTA ATATTGCGAT GGTACTGACT 780 
GCTCAAGCGA TTGTTGATAA CTTAGATACT 840 
GCTGGTCCAG GATTCATTAA TTTTTACTTA 900 
GAAGCAATTG AAAAAGGTGA TCAATTTGGA 960 

TTGCTTGAGT ATGTTTCAGC TAACCCTACA 1020 

GCAGCAGTTG GTGATGCTTT AgeTAAtATT 1080 

GAATATTATA TTAATGATGC TGGTAATCAA 1140 

CGTTTCTTTG AAGCTTTAGG TGACAATAGT 1200 

AAAGATATTA TTGAAATAGG TAAAGATTTA 12 60 

TCTGAAGAAG CACGTTTGAA AGAATTTAGA 1320 
TTGAAAAATG ATTTAGCAGA GTTCAATACG , 13 80 

TTATATGAAA AAGGAGAAAT TCTTGAAGTT 1440 

TATGAAGCTG ATGGCGCTAC ATGGTTACGT 1500 

GTATTAATTA AAAATGACGG TACATATACG 1560 

GATAAAGTAA AACGTGGTAA TGACATTTTA 1620 

TATATTAATC GTTTGAAAGC ATCTCTTGAA 16 80 

ATTCAAATCA TGCAAATGGT TCGTTTAATG 1740 
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ATTATGGACG AaGTTGGCGT TGACGCTGCA CGTTATTTCT TAACTATGCG TAgTCCTGAT 


I860 




AGTCACTTTG 


ATTTTGATAT GGAATTAGCG AAAGAGCAAT CTCAAGACAA 


TCCAGTTTAC 


1920 


5 


TATGCTCAAT 


ATGCACATGC GCGTATTTGT TCAATTTTAA AACAAGCGAA 


AGAGGAAGGT 


1980 




ATTGAAGTGA 


CTGCTGCGAA TGATTTTACA ACGATTACTA ATGAAAAAGC 


GATTGAATTG 


,2040 




TTGAAAAAAG 


TAG CTG ATTT CGAACCTACA ATTGAAAGTG CTGCTGAGCA 


TAGATCGGCA 


2100 


to 


CATAGAATTA 


CTAATTATAT TCAAGATTTA GCTTCTCATT TCCATAAATT 


CTATAATGCT 


2160 




GAAAAAGTGT 


TAACAGATGA TATTGAAAAA ACAAAAGCAC ATGTTGCTAT 


GATTGAAGCG 


2220 


15 


GTCAGAATTA CATTGAAAAA TGCATTGGCA ATGGTCGGTG TAAGCGCACC 


TGAATCAATG 


2280 


TAAGAACATT 


TATATACACT CCAACGTAGA GTTTCTCGAA AGATACTTTG 


TGTTGGAGTG 


2340 




TTTTTTTTAG 


GTATGTGACA TATTGGGGAA TGCTTAGT AT GTGAATAAGG 


TTAAGAGGAA 


2400 


20 


CACAGTTGGA 


TGCTCTGCAC AACTG CAT AA GAGAGCCTGA GACATAAATC 


AATGTTCTAT 


2460 




GCTCTACAAA 


GTTATAATGG CAGTAGTTGA CTGAACGAAA ATTCGCTTGT 


AACAAGCTTT 


2520 




TTTCAATTCT. 


AGTCAACCTT GCCGGCGGGG CCCCAACAAA GAGAAATTGG 


ATTCCCAATT 


2S80 


25 


TCTACAGACA 


ATGCAAGTTG GGGTGGGACG ACGAAATAAA TTTTACGATA 


ATATCATTTC 


2640 




TGTCCCACTC 


CCTCTAAAAT GGAGGGTGTA AATGTTAGGA ACTGATGAAT 


TATATAAAGT 


2700 




TTTATATGAA 


CATCTCGGAC CACAATTTTG GTGGCCTGCT GATAATGACA 


TTGAAATGAT 


2760 


30 


GTTAGGTGCA 


ATTTTAGTTC AAAATACTAG ATGGCGAAAT GCAGAAATTG 


CATTGAATCA 


2820 




GATTAAAGAA 


CATACGCATT TTAATCCAAA TCATATATTA GAACTACCTA 


TTGAAACGTT 


2880 




ACAATCATTG 


ATACATTCAA GTGGCTTTTA TAAAAGTAAA .TCACTGACGA 


TTAAAACATT 


2940 


35 


ATTAACATGG 


TTAGCACGAC ATCATTTCAA TTATCAAGAG ATTAATGAGC 


GATATAAAGG 


3000 




TGGATTAAGA AAAGAATTAT TATCTTTGAA AGGTATTGGA AGTGAAACAG 


CAGATGTCTT 


3060 


40 


" ACTTGTTTAT 


ATATTCGGAC GTATTGAATT TATTCCAGAT AGCTATACAA 


GAAAAATATA 


3120 


TGATAAATTA 


GGATATGAAA ACACTAAAAA TTATGATCAA TTAAAAAAAG 


TAGTCaCATT 


3180 




ACCAAATCAT 


TTTACAAATC AAGATGCTAA TGAATTTCAT GCTCTGTTAG 


ATGTATTTGG 


3240 


45 


TAAACATTAC TTTAGAGACA AAGATATAAA GAATTATGAT TTTTTAGAAC 


CTTACTTTAA 


nnn 
JJUU 




AAAGTAAACG 


CTGTGAAGTT AGATAGATGA GTTTATATGA AATATAAAAA ATAATTTACT 


3360 




ATTTTCTTTT 


AGTATGTGGA CTTATATAAT AAATAGAAGC ATATAAAGAA 


AAAAACAGTT 


3420 


SO 


GTTTGTTTGT 


GCAGCAACTG CATAAGAGCC CCTAATCGCT AAAGCTCAAG 


GGGAGTAAAG 


3480 




GAATACAGTT 


GTTTGTGCAG CAACTGCATA AAAGCCTCTA ATCACTAAAG 


GTGAAGAGGA 


3540 
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AACG CAGTTG GATgCTACCG CACAACTGCA TAAATCCCTC TaATCgcTAA AGCGAAAAGT 3660 

GGGATTAAAA AGGAGATGTG ATAGTGTGAA GAAATCGTTA ATTGCTTTTA TTTTGATTTT 3720 

5 TATGCTTGTC CTGAGTGGCT GTGGTATGAA AGATAATGAT AAACAAGGTA GCAATGATAA 3 780 

' TGGCTCGTCT AAATCGCCGT ACCATAGAAT TGTTTCGTTA ATGCCTAGTA ATACTGAAAT 3840 

TTTATATGAA TTAGGATTAG GTAAATACAT AGTTGGTGTT TCAACGGTTG ATGATTATCC 3900 

10 AAAAGATGTG AAAAAGGGTA AGAAACAATT TGATGCTTTG AATCTAAATA AAGAGGAACT 3 960 

TTTAAAGGCA AAGCCAGATC TAATTCTTGC GCATGAGTCG CAAAAGGCAA CTGCTAATAA 4020 

AGTATTGTCA TCATTAGAGA AACAAGGCAT CAAAGTAGTG TATGTTAAAG ATGCACAATC 4080 

15 

AATTGATGAA ACTTACAACA CATTTAAGCA AATTGGGAAA TTAACGCATC ATGATAAGCA 4140 

GGCTGAACAA CTTGTTGAGG AAACTAAAGA TAATATCGAT AAAGTCATAG ATTCAATTCC 4 200 

TGCTCATCAT AAAAAATCAA AAGTATTTAT TGAGGTTTCA TCAAAGCCTG AAATATATAC 4 260 

20 

AGCAGGGAAG CATACATTTT TTAATGATAT GTTAGAAAAA TTAGAAGCCC AAAATGTGTA 4320 

TAGTGACATT AATGGTTGGA AC CCTGT AAC GAAGGAAAGT ATTATTAAAA AGAACCCAGA 4380 

25 TATATTAATT TCGACGGAAG CTAAGACAAG ATCAGATTAT ATGGATATCA TCAAAAAAAG 4 440 

AGGTGGATTC AATAAAATTA ATGCTGTCAA GAATACACGT ATTGAAGTTG TAAATGGTGA 4 500 

TGAAGTATCA AGACCAGGTC CACGTATTGA TGAAGGATTA AAAGAATTAA GAGATGCAAT 4 560 

30 TTATAGAAAA TAAACCATTC TAATTATGCC CCTTATTGCT ACATGTAAAA AATACATGTT 4 620 

TGAGATAAGG GGTTTTTaAA ATATATTTAG TGAATGATAG CAACGCGAGT ATGTGATTGC 4 680 

TATAATGAAT GTAATTATCG ATG AAc a aAA GAGAATGCTA TGACATTTAA TAAAGTATTA 4 740 

35 TTGAGCTGCJa TAGTCmTATT GATTATAACA ACTAGCATAT ATCTATTTTG GCAGTTGGGC 4800 

GATATCAATG ATGTATTTAA CCAGTCTATT TTAATCAATG TTAGATTACC GAGATTATTA 4 860 

GAAGCATTGT TGACAGGTAT GATATTAACT GTTGCAGGCC TTATATTTCA AACAGTTTTA 4 920 

40 

AATAATGCAT TGGCAGATAG CTTTACATTA GGATTGGCAA GCGGGGCTAC ATTTGGTTCA 4 980 

GGATTAGCAT TATTTTTAGG TTTAACAACG TTATGGATTC CTGTATTTTC AATAACATTT 5040 

AGTTTGATAA CATTAATAAC TGTATTAGTC ATTACGTCGG TATTGAGCCA AGGCTATCCA 5100 

45 

GTTAGAATCT TAATATTAAG TGGTTTAATG ATTGGTGCGT TATTCAATTC ACTTCTATAT 5160 

TTTTTGATTT TATTAAAACC TCGCAAATTA AATACAATTG CCAATTATCT GTTTGGTGGT 5220 

so TTTGGTGATG CAGAATACTC AAATGTATCT ATAATAGCAA TCACATTTAT CATTGCATTG 5280 

TTTGGTATAT TTATCATTCT TAATCAACTA AAGTTATTGC AATTAGGAGA ACTAAAAAGT 5340 

55 
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ATAACGGCGA 


TAAATGTCGC 


ATATGTTGGC 


ATCATTGGAT 


TCATTGGTAT 


GGTGATACCG 


. 5460 




eAACTCATTA 


GAAAATGGCA 


GTGGAAACAA 


TCATTAGGAA 


GACAATTGGC 


TTTAAATATT 


5520 


5 


GTAACTGGAG 


GACAAATAAT 


GGTTATGGCA 


GATTTTATTG 


GTAGCCATAT 


ATTGTCACCA 


5580 






CGGCAAGTAT 


TATCATTGCA 


TTAATTGGTA 


TACCAGTGTT 


At TTTACaTG 


5640 




rlcAAwAt CtC 


aGTCaAAAcG 


GTTACa CTAG 


CACACGACaT 


TTGCTAAAAT 


AAAAATAACT 


5700 


10 


ATAAAPATAA 


AGAGGGCATA 


AGCGATGGAT 


TTGAATCAAA 


TTAAAGCAGT 


TGTATTTGAT 


5760 






rTiTTCiTTGGA 

X X \3 X X NJ^J*V 


-CAGAGTTAAA 


TCTCGAGAGA 


AATTTATCGA 


AGAGCAATAT 


5820 






#\ JL \M\\~ X X X 


AATTCATGTT 

JVli * X WX X 


CAACTGGCAG 


ATTTTAAAAA AgCATTTATT 


5880 


15 






TAATGATAAA 


C CTGATTT AT 


ATAAAGAAAT 


CATTAAACGT 


5940 








TTYVSAAAGAC 


TTATTTAATG 


ATTTTGAAAT 


GCATTTTTAT 


6000 


20 






. CGATACTTTG 


TATACACTAG 


AAAAgCTATC 


GCAAAAAGGC 


6060 


TTTCAAATTG 


GTCTTATCGC 


AAATGGTAAA 


TCTAAGATTA 


AACAATTTCG 


ATTACATTCA - 


b L4\J 




CTTGGTTTGA 


TGCATGTTAT 


TAATTATTTA 


TCAACATCAG 


AAACAGTTGG 


TTTTCGTAAA 


6180 


25 


CCACATCCTA 


AAATTTTTGA 


AGATATGATT 


GATCAACTAG 


GGGTATTACC 


TGAGCAAATT . 


6240 




ATGTATGTTG 


GCGATGATGC 


GTTAAATGAT 


GTAGCTCCAG 


CACGAGCTAT 


GGGCATGGTT 


6300 




AGTGTATGGT 


ATA 










6313 



(2) INFORMATION FOR SEQ ID NO : 202: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 2174 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 202: 



40 



45 



50 



CCGTAAACAC 


ATCAACAAAA 


GAAGGCTATA 


TTACAAAAGA 


AGACTTGGAC 


TTATGCTGCA 


60 


CGTCGCTCTA ATTCAGCTGG 


AATGCAAGTC 


ACCGGACGAC 


TGGCTTACAT 


TGAACCTTAT 


120 


GGGGCAACAA 


GTCGCACAAA 


ATAAACGCGC 


GAGAAGCaAG 


AATAGGAAGT 


GATATCTATG 


180 


AAATGGTTAT 


CACGAATATT 


AACAGTAATA 


GTGACCATGT 


CtATGGcGTG 


TGGTGCATTG 


240 


ATATTTAATC 


GTAGACATCA 


GCTAAAGGCG 


AAAACGCTGA 


ACTTCAATCA 


TAAAGCATTA 


300 


ACAATTATTA 


TTCCGGCTAG 


AAACGAAGAA AAAAGAATAG 


GTCATTTACT 


ACATTCGATA 


360 


ATACAACAGC 


AAGTTCCAGT 


AGATGTCATT 


GTTATGAATG 


ACGGATCGAC 


AGATGAAACA 


420 
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AAATGGTATG GGAAATCACA TGCTTGTTAT CAAGGTGTGA CGCATGCATG TACGAATCGC 540 

ATTGCCTTTG TAGATGCTGA TGTAACTTTC TTAAGGAAAG ATGCTGTTGA AACGTTGATT 600 

5 AATCAGTATC AATTACAAGG TGAAAAAGGA TTGTTAAGCG TACAGCCTTA TCATATAACA 660 

AAGCGTTTCT ACGAAGGGTT TTCAGCGATA TTTAATTTAA TGACAGTCGT TGGTATGAAT 720 

GTATTTTCTA CCTTAGACGA CGGTCGGACT AACCAGCATG CATTTGGACC GGTGACATTA 780 

10 

ACAAATAAAG AAGATTATTA TGCAACTGGA GGTCATAAAA GTGCAAACCG TCATATTATT 840 

GAAGGATTTG CTTTAGGAAG TGCATATACT TCACAATCAT TGCCCGTAAC AGTTTATGAA 900 

GGGTTTCCAT TTGTTGCATT TCGCATGTAT CAAGAAGGAT TTCAGTCATT ACAAGAAGGA 960 

75 

TGGACAAAGC ATTTGTCAAC TGGGGCAGGT GGCACAAAGC CTAAGATCAT GACAGCAATT 1020 

GTGTTGTGGT TGTTTGGTTC TATAGCGAGT ATTTTAGGGC TATGTCTTAG TTTAAAATAT 1080 

20 CGCCAAATGT CTGTAAGAAA AATGGTAGCA CTTTACTTGA GCTATACTAG ACAATTTATT 1140 

TATCTGCATG GAAGGGTCGG CCAATTTTCT AATTTATTAA TGGTATGTCA TCCATTGTTA 1200 

TTTATGTTTT TTACTAAAAT TTTCATCCAA TCTTGGAAAC AAACGCATCG TTATGGTGTA 1260 

25 GTTGAATGGA AAGGTCGTCA ATATTCTATA TCTAAAGAAC AATAAATCAA GGTAATGGCA 1320 

TTTCAATATA GGAGGACTAG TATGACAATG ATGGATATGA ATTTTAAATA TTGTCATAAA 1380 

ATCATGAAGA AACATTCAAA AAGCTTTTCT TACGCTTTTG ACTTGTTACC AGAAGATCAA 144 0 

50 AGAAAAGCGG TTTGGGCAAT TTATGCTGTG TGTCGTAAAA TTGATGACAG TATAGATGTT 1500 

TATGGCGATA TTCAATTTTT AAATCAAATA AAAGAAGATA TACAATCTAT TGAAAAATAC 1560 

C CAT ATG AAC ATCATCACTT TCAAAGTGAT CGTAGAATCA TGATGGCGCT TCAgCATGTT 1620 

35 

GCACAACATA AAAATATCGC CTTTGAATCT TTTTATAATC TCATTGATAC TGTATATAAA 1680 

GATCAACATT TTACAATGTT TGAAACGGAC GCTGAATTAT TCGGATATTG TTATGGTGTT 174 0 

GCTGGTACAg TAGGTGAAGT ATTGACGCCG ATTTTAAGTG ATCATGAAAC ACATCAGACA 1800 

40 

TACGATGTCG CAAGAAGACT TGGTGAATCG TTGCAATTGA TTAATATATT AAGAGATGTC 1860 

GGTGAAGATT TTGACAATGA AC GG AT AT AT TTTAGTAAGC AACGATTAAA GCAATATGAA 1920 

4S GTTGATATTG CTGAAGTGTA CCAAAATGGT GTTAATAATC ATTATATTGA CTTATGGGAA 1980 

TATTATGCAG CTATCGCAGA AAAAGATTTT CAAGATGTTA TGGATCAAAT CAAAGTATTT 2040 

AGTATTGAAG CACAACCAAT CATAGAATTA GCAGCACGTA TATATATTGA AATACTGGAC 2100 

SO GAaGTGAGaC AGGCTAACTA TACATTACAT GAACGTGTTT TTGTGGaTAA GAGGAAAAAG 2160 

GCAAAGTTGT TTCA 2174 

55 
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(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 4715 base pairs 
(3) TYPE: nucleic acid 
(C) STRANDEDNESS : double 
* (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 203: . 

10 GAAnCAGnTA GACAAATTAT GGaAAmCGGT GTGAATCaAG GATTCt TTGG TGTAGCTGGT 60 
TTTGACCTAC TCGTCGATGA , GGATGATAAC GTTTATGCGA TTGATTTAAA CTTTAGACAA J 120 

AATGGTTCaA CGAGCATGTT ATTACTTGCT AACGAGTTGA ATTCAGGATA TCAAAAGTTT 180 

15 

TATAGTTATC ATTCAAAAGG TGATAACACA CATTTCTTCA ATACGATTTT GAAATATGTC 240 

AAAGAAGGTA GTTTATACCC GTTATCTTAT TATGATGGTG ATTGGTACGG TGAAGATAAA 300 

GTTAAATCAA GGTTTGGCTG T ATTTGG CAT GGTGATTCAA AAGAAACAGT ACTGGAGAAT 360 

20 

GAACGCGCAT TTTTAGCTGA ACTTGAACAC TATTAGAGTT CGGAACATAA GGCGCTACAA 420 

TGTTGTGTTG CCAGTAGTTG ACTGAATATG CGTTTGTAAC AAGCTTTTTT CGATTCTAGT 480 

2S CAACAGTAAT TAAATTTATG ATATGGCAAT ACTTTGTAAT ACTAATATTA AATGGCGACT 54 0 

TTTATTTCAC TATGTTATAA GAGTTGCCAT TTTGTTGATA AAGGTATACT AAAGGTTATC 600 

GTTTTGAAAT TTTTAGTAAC TAGATATGTT TCGTGTTATA. GACCGAATTT GTGTATACGT 660 

30 AAAATTTAAT GCTATTGAAT TTTTAAAATG AAAAACATGA CATTAAATTG AATTCATAAT . .720 

ATGTCTAATT GACTAACTTG TTGGAGTCAT TTACTATTTT ATGTATGACA TATTTTAAAA .780 

AGTGAGGGTC AAGCATGTCT TATAAAGCAT ATCCATTCTT TAGAGATATA TTAATAAATG 840 

35 AATGTATTTA TTTCGCCTCT AAAAATAAAA AACTAGTACG CCTAAATTAT ; AAAAGTGAAG .... 900 

CGnA^GTAGG CGTTTGGACA GAAGAAAGTG TGGCCGTATC ATTTTTAACA AGTCGTGATA 960 

TTCCATTTGA TAAAGTTGTA AAAATGGACG TTGATCGTTT TGCTACTTAT GAATTAGATG 1020 

40 

AATTGTTTGA TGAACAAGAC CATATTATTA TGAATCAAAC AATGGAAGAw GAAGGGCATC 1080 

TACTAAACGT TGTAGCTGTT ACACAAGAAG TGATGACGGA ATTAGATAAA ATTAGAATCA 1140 

AAGAATTTGT CCAAGATGTA GCGAAATATG ATGAAGTATA CGGCTTAACT AAAAAAGGTA 1200 

45 

GTAAGCAGTT TATTCTCATT AGTGAAAATG ATAGCGACGA AAAAAAGCCG CATATTATGC 1260 

CTGTATGGAG TATTAAAAAC AGAGCGTTAA AAGTTCGAGA TGAAGATTTT GAAGAGTGTG 1320. 

so ATTTAATTAC GATTGAAGGT TCTGTTTTCG GAGAATGGCT AGATGAACTT AGAGATGATC 1380 

ATAAAGCCGT TGCGATAGAT TTAAAAACTG GCGTGGTTGG TACAATTGTT TCAGCGCAAA 1440 

55 
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ATGGAACAAT 


ACGTATTCAA 


A A PA PTTAGA 


AT & a a tat A 
ViV<niiw\nln 


A & n.fZflT'C* ATT 


TUTaTAfiPftT 


1560 




TTATTTAAAA 


CAACGCGCAT 


ATAAATGGTC 
ninnniou x v» 


TTTTTPT&TT 
x x x x x ini 1 


fiHiMii/ **i*fv a a^pa 
x X X Innnlh 


TA ftTfiPAPPA 


1620 


5 


ATAGCACCTG 


nAAAATGCGC 


CCVVVWCBk A P 

Vj X X X X V»nf%V» 


atacst a rryiT 

■r* x x nii.VTj x 


TTfzr*AAr*rv2r' 

X 1UUAAWV.UV,. 


fiTAArAPAP.T 


1 O A 




ATAATCTTCC 


nwwv> x x x w*w 


GTAATAAAGr! 


fiTT ATT A*TY2 & 


AATrtA&rtAAP 
nn X unnvinfiU 


^fiflTATAAAP 
V. \3 A X A X AAA V* 


1/40 


10 




fiTTTTA A ATT 


CACGTCr!AA r* 


AflTAATfirtrP 


ATTOTrviTa a 

AX XvjXV»V7XAA 


|™» a A PTTPftPP 


1800 


AACGAdACCA 


ATAArnnfTfl 


LXAAX X inl X 


UV, lAuu X In 


nnnlWiuwil 


f*ra a stp a tp* 

L*XAAAXwAXvj 


T O C rt 




TAflTArATRA 
x x A\*4\ X un 


POA&& ATT Art 


V— X VJU lW X X AA 


n. 1 LAV, L^UVjvjrA 


AlVjVjVj ILtVj 1 1. 


CGG TAT CTTT 


1920 


15 


ATAAATA1Y1T 
nlnnnlniVjl 




AAX LuA IA<J 1 


ftTTaPrtfcTPri 
V* iA^vAlwi 


ULu lvj X i\J xv» 


u vJA I\»TC!AG T 


1980 


• 1 ■ TV A f^*T*t »I»T"I'K 

X nML iu X X X A 


TA atv* ap**tv* & 

1 AA XV*Al7 XVjA 


TTTGACTTAG 


1AAAX.AAL.Uvj 


AGTCCTTGAA 


TCATGCCTCC 


2040 




nLL 1\J 1AV.UJ 


PA T* 71 a 

A 1 Av~lAxl*U 1 A 


p*a pv* a 


TUATTGGCCG 


tcgaaataat 


GT AGTGACGT 


2100 


20 




ALAl HTjCaA 


a A A T* A T> A A T*/"* 

AAATATAATC 


m/^# nil* TV/"*rp/*t * 


TGGCCTTGCT 


CTTTTAACAA 


2160 




7A A '"PA /"^rT 1 A /""""P 


C Cri IGAGATG 


/i T» »T»/*» A TV TV 

CAGCATCAAA 


CTCTACAAAA 


ATTTGTGCAG 


GAATGTTGAT 


2220 




V» 1 1 1 1 UVJUi 


A x\» As-At- v~ Ivj 


f"^ TV rnrn 7\ r^f^r^f^f* 

IJA1 1AL-L.X(_(_ 


AGTTAAGCAT 


AA'iTlTl'CAA 


TTTGCTGTTG 


2280 


25 




TCCACAACTT 


/*»« Tv t*/*' a a ^ a <ph* 
GATCAATATT 


TTTAGTTAAT 


TCAGTTTTAA 


AAGTACGTTG 


2340 






TCTTGAACGA 


TTTTAATTAG 


TGTACCGCCA 


G CGTCAATGC 


CAACTTTCAT 


2400 




An^Mi 1 l_L.<wA 


CCTCATTATT 


a a T , f"TV "i' a 
AAivjiLiAK. 


Q.X lAAAxAAx 


AGTATAGTAA 


AATGACTAAA 


2460 "« 


30 




lAAlAulAAl 


ttiTtr a /"^a a a 
xATTAAv_AAA 


TTTGATG C C si 


TTGCATTTCA 


ACATTGTAAG 


2520 




r-riTaTHPJT'a A 


■ k " 1 ' TV A ^ f * ^rf 1 '!**!"!' 

1 InALul 1 X X 


AuflAALlj 1 vjO 


a/^v'TTa a /~"T'*- 
At-Ajl 1 C 


TV i-n A T" IV T* A • I" 1 » A 

AxATATATTA 


TTTTCTAGGA 


2580 


35 


& ' I w 1 ** I " 1 V i a a f^lT^ 
nl 1 li vj./-LAv_j X 


luiA iALnjAl 




X Av-AjV-AA 1 A 


>■•']• A a A A /~**T* A 

X IAAAACjIAvj 


TTCGTACGCA 


2640 


GTGT ATTTf^T 

VJ X w -Lf\ X X X VJ X 


a &i "i ■f"""Tr "i'PS a 


TTaaaATrtAT 
X iivvvilvsnl 


nnu X AA ±\j*\\j 


unn X Aur lALn 


TTAATTTTGA 


2700 




AATTTAAAAA 


ATATAAATAA 


PJTA aTTTATT 
VJ^/vtl X XAX X 


Innv. X Inufvj 


fa a aTa jlttzti 

Unnnlnniw 


TttTPPTlCTP 
iAlLvjlAvrivj 


^ / bU 


40 


AAATAATAGG 

******* X X *VJw 


TAAAATAATA 


Tfifi£3fiATTCA 

X VTVTVTVXT^ X X V— 


TfiPTTPATl T 


aTaaaAArtAT 

A X AAAAAUA X 


afirtfviTTa a a 

AwVvVjvvX X AAA 


"5 O *5 A 


TATATGGCTA 


AAGAACTTTG 


TTTTOAAC3GT 

x x a x wnrvwvj x 


ATPA PTTTA A 
niwiv^i x inn 


AAGCATTTGA 


TGAACAATAT 


o a an 

«t)DU 




CGTTCAGCAA 


TTAATGATTT 


TGACTTGAAT 
x wAw x x usnn x 


fJAAAfiAfAAr* 


AAATATATTC 


ATCTTTACCT 




45 


AAAGAAGTTA 


TTGATGATGC 


AATTAATGAT 


GCTGATAGGA 


TTGCTAACGT 


AGCAwTAAmC 


3000 




GATAAAAATG 


AAGTGGTGGG 


CTTTTTTGTA 


TTACATCGTT 


ACTATGAGCA 


TGAAGGTTAT 


3060 




GATACACCTG 


AAAATGTCGT 


TTATATTCGT 


TCATTATCGA 


TTAATGAAAA ATATCAAGGT 


3120 


50 


TTTGGATATG 


GCACGAAAAT 


AATGATGTCA 


TTGCCGCAAT 


ATGTTGAAGG 


TGTATTTCCT 


3180 




GATTTTAATC 


ATCTATATCT 


AGTAGTAGAT 


GCGGAAAATG 


ACAATGCTTG 


GAACCTATAC 


3240 
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5 



10 



15 



20 



35 



40 



45 



CTATATTACT 


TGGACTTAGA 


TTCAAAACAT 


GTTTCATCAT 


TAAAGCTTGA AGAAGAAAGT 


TOf ft 


CGTTCAGAAG 


TGACCAATGT 


ACATATCATT 


AATTTAATGA 


TTGATGGGCA AAAGGTTGGC 




TTTATCGCAT 


TGGAGCAGAT 


TGGTGAACGC 


ATGAACATTG 


CTGCTATTGA 


AGTGGATAAA 




TCATATCGCT 


TTAATGGTAT 


TGGTTCAAGT 


GCTCTGCGAC 


AATTGCCAAC 


TTACTTAAGA 




AAAAACTATG ACAACCTTAA 


TGTGATTACG 


ATGATTCTGT 


TTGGAGAGAA 


TAATGATTTT 


Tfiftft 
JOUU 


AAACCATTAT 


GTTTAAATAG 


TAATTTCGTT 


GAAATCGAAC 


AAACTGATGA 


TTATGTCGTT 


JbbU 


TTCGAAAAAT 


ATTTAAATTA 


CTAACAGTGA 


TTGCGAAATA 


TGATATTGTC 


ATTTATAATT 




TAGTTTTGTT 


ACTATATATA 


AATGAATTCA 


GACGTATAAA 


TTTAGATTAT 


ATCCTT CGAA 


3780 


AGGAAGTATT 


GGGCAATGAA 


AATTCAAGAT 


TATACAAAAC 


AAATGGTTGA 


TGAAAAATCA 


3840 


TTTATTGATA TGGCTTATAC ATTATTGAAT GATAAAGGCG 


AAACAATGAm 


mTTATATGAT 


3900 


ATyATCGATG AATTTAGAGC 


GTTAGGTGAT 


TATGAGTACG 


AAGAAATTGA 


AAATCGTGTT 


3960 


GTACAATTTT 


ACACGGATTT 


AAACACAGAT 


GGTCGTTTTT 


TAAATGTTGG 


AGAAAATTTA 


4020 


TGGGGATTAC 


GTGATTGGTA 


TTCGGTAGAT 


GATATTGAAG 


AGAAAATCGC 


ACCAACTATT 


4080 


CAAAAATTCG 


ATATTCTGGA 


TGCAGATGAT 


GAAGAAGATC 


AAAACTTAAA 


ATTATTGGGC 


4140 


GAAGATGAAA 


TGGATGACGA 


CGATGATATT. 


CCAGCTCAAA 


CAGATGATCA 


AGAAGAACTA 


4200 


AATGATCCAG 


AAGATGAGCA 


GGTTGAAGAA 


GAAATCAATC - ATTCGGATAT 


AGTCATTGAA 


4260 


GAAGATGAAG 


ATGAACTAGA 


CGAAGACGAA GAAGTGTTTG ' AAGACGAAGA AGACTTCAAC 


' 4320 


GATTAATTTT 


TTGTTTGACT 


TTTAGTTGAA 


AGATGATAAA 


ATTTTATTCG 


GGCTC CTTTA 


■ 4380 


AATAGGACAC 


GTGTATAAAA 


TTTATACGCT 


CCCCTTACAG 


AATTTGTGAG 


AGGGAGCGTT 


4440 


TTTTtATTTA 


ATTGAGTAAA 


TCAAGAAATG 


ATAACGCAAA 


AATCAAAGTT 


GTAAATGAT A 


4500 


TACATAGTGA 


CATAGCAGTA 


TGGAAACGGT 


AAGTAAACAG 


AATTTAATTT 


TGTCGAtTCG 


4560 


ACAAtAAaCA 


aCTtGAaTGA 


GCTTGCTTTA 


ATGTTATGTn 


nTACGTAATT 


TTTACAATTG 


4620 


ATGAGGAAGC 


ATTCCCTTTA 


ATAATTAGGA 


GGTCAAGACA 


TGACAAAATT 


TATTTTTGTA 


4680 


ACAGGTGGCG 


TAGTTTCATC 


CATTAGGGGA AGGGT 






4715 


(2) INFORMATION FOR SEQ ID NO: 204: 









(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 918 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNES S : double 
SO (d) TOPOLOGY: linear 
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ATAATAACTG AAATTAAAAT TGCTAAATmG TGTTaAgCTA TCGCmACAAT GAAAATwCCG 60 

ATTTTGCGTT GTTGAAAATA TCTTTCCAAA CCAAGAATCG ATAATGGCAA TAAATATAAT 120 

AAATTTCCAT AAAATGACCA AGTAAAATTA AAGTATATAA CGACAGTTGA CATGCCGTAT 180 

AAAATCGTAG CGATCATATT TGCTGAGCGT TTAAAGTGTA ATATTTTAAA TAAGTAGAAG 24 0 

GTCACGACAA ATGTTATGAT AGCTCGTATC ATAGCCATAA TAAGTTGGTT TGTCGGCCAA 300 

AAATGTATTG TCGTCGGATT AAATATACCA ACCGTTTCTC CTATTTTAAT GAAkAGAAAA 360 

TTTTAGCCACA TTAAAGGTGA CAGCGAATAA TAATnTGATA GTCCTTTCAT ATAATCGCCA 420 

CCTAmTCCAA ACGATGCATC ATrTAAACTA GAAnAACTAC GTAGATGTTC ATACAnATAC 4B0 

ATTTGAAATG GCATCATTTG ACGGAATCCA TCTCCAGCCC CGCTAAAAAC AGTACCATTC 540 

ACAATATAAT CATAGATATG AGTAGAAAAT AAAATAAGCG TTAATATTAC ACTAATGAAA 600 

20 GTTATAACAA AG AATTGTTT GACGTTTGAA TTTAGCCACT TTTTTAACAC AACATTATCC 660 

TCAACTTTCA AATTTAAAAT TAAGTTTAAC TGAAACTAAA GTTAATGAGG TTCTTGATAG 720 

GTAAAGACGA AGATGACTGT GGAACAGATA CCTTATCAT A GTTACTTAAA CTTTGGATCA 780 

25 TTTTCAGTTT ATCATTAAAC AAATATATTG AATAATAAAa aTGTCATACT GATAAAGATG 840' 

AATGTCACTT AATAAGTAAC TTAGaTTTAA CAAATGATGA TTTTTAATTG TAGAAAACTT 900 

GAAATAATCA CkTATACC 918 

30 

(2) INFORMATION FOR SEQ ID NO: 205: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 163 97 base pairs 

(B) TYPE: nucleic acid 
35 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 205: 

AO 

TCGCCCnATA ATCAATTTAT TTTTCATGTG CCACTCCTAT ACAAGCTnAC AATGCTTCTT 60 

CAGTTAAGGC AATATCTTTT AATTTTGTTT GATATTTTTG TTCAAAGTCA TATTGTAACT 120 

45 GAACAATTTC TGGCAAACCA ATATGCCAAT CCGCCAATTT TTTTTTAyCT TtGAAGAGCT 180 

CTTTTGGTGA TGkTTGcGAC ACTATACTAC CTTCTTTCAT AACGATGACT TCATCTGCAT 240 

AACGCGCGAC TTCATTCATA TCATGTGAAA TTAGGATAAT TGCCTTATTT TCATCTGTTT 300 

50 GTAGTGACTT TAGTAATCTC ATTACTTGTC GTTTACTTTG TGGATCAAGT CCTGCTGTAG 3 60 

GTTCATCAAC CACGATAATA TCAGGATTCA TTGCCAATAT CGATACAATC GCTATTTTAC 420 
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AATCCATCAA CAGACGATGG GCATAGTTTT TGGCTTCATC TAAATTCATT TTAAAGTTTT 540, 

TAGGTCCAAA TATCATTTCA CGCTCTACTG TGTCCTCAAA TAATTGAGAT TCGGGAAATT 600 

5 

GAAATACCAT TCCAATTCTT TTTCTTACAG GTCTAATATA TTTATCTTTG GTCTTATGTG 660 

TAATAGTAAT GTCATCAACT GTAACTGTCC CAGTAGTCGG CTTTAACAGC GCATTAATAT 720 

TTTGTATCAA CGTTGATTTA CCACTACCCG TTTGTCCAAC GATGGCGTAA TATTTACCTT 780 

10 

GTTCAAATTC TGTATTAACA TCATGAATAG CTTGATGCTG ATATGGTGTC CCTTTTTGAT 840 

AGGTATAACT TACATTGTCA AACCGTATAG TCATAGTTGA TCCACCAGCC CTTCATAAGT 90 0 ( 

' TAAGAATGAT GTTTGGTGTC CCAGCATTTG ATTTATTTTG ATTGGGAATG GCAAATCTAG ^ 960 

ACCTATTCTT GTTAACTCTT CTGCATTGTC GAAAATTTCA GTCGCTGTGC CTTCTTTATA 1020 

GACAGTCCCT TTATTCATAA CGATAACATG ATCTGCTTCC ATCGCCTCAG ATAAATCATG 1080 

20 CGTAATAGAA ATGATTGTAA TATTATGTTC TGATTTAACT TTTCTCACTA AATCGAATAA 1140 

ATTTTGACGT GCATCAGGAT CTAACATAGA AGTCGCCTCA TCTAATATAA TGACAGAGGG 1200 

GTTAAGTGCT AATACACTTG CTATAGCCAC ACGCTGCTTC TGTCCCCCCG ATAATGCATT 1260 

25 AGGTTCATAA TCTGCACGTT CTAACATATC AACTTGTTTA AGTGCTT CGC TGACTCTTCT 1320 

ATGCATTTCG TCATATGGAA C CGCATG ATT TTCGAGTCCA AATGCCACAT CGTATTTTAC 1380 

AATTGAACCA ACAAATTGAT TATCCGGATT CTGAAATACA ATTCCTATGT CTTTTCTTAA 1440 

30 CTTTTCAAAA TTATCATCAG TTATAGCTTG ATTATTATAA AAAATTTCTC CAGATTTAAC .1500 

TTTCTCTATG CCAATCATTA ACTTGGcAAT TGTAGATTTT CCAGAACCGT TATGACCAAC .1560 

AATAGATGTC CACTGACCTT TAGGTATATT AAAAGAAACA . TCTTTCAATG TGAAGGATGC 1620 

35 

ATCACTTTGA TATTGAAATG AAACATTTTT AAATACAATA ACTGAATTCT. TATCCTCCAC 1680 

TTGTCTCTCT CCTTTACGAT TCGTGTATCT ATCATATTTT ACAATATTTA TAAATCGCTG 1740 

TATATGACAT TGACTGGGTT CTCTATATAT TACTAGTATT TTCTGACTCA TTTCTAGTCT 1800 

40 

TTAAAGTGTT GTTTAACAAC TAATGATAAG GACTTTTATT CCTCTCTAAC AATTATGTAT I860 

AAACGTTAAT AAAATAAATG ATTTACTAAT ATAGGGGTGG TCGCGTTTGA TTCAACGATA 1920 

ATACTTTCAC TTCATTCAGT TCTAGTGAAA TTGATCAAAC TAGCTTCATC ATATTTTTAG 1980 

45 

ATTCGCACTC AAAAAAGTAA ATATAAAGAA ATCGGACTTA AAAACATTTC TGTTCATAAG 2040 

TCCGATATTT TATTCAATAA AAAAGCGCGC ACCCCATCAT AAGTTTGTTG AGTTCACGCT 2100 

60 TTAAATCTTT ATTTAGTTGA TGGGGTACTC TGAGCTAGAC AATATTTGTA TGTGGCAAAC 2160 

ATTAt CGTTG CACTCATTTG CTTTATATAA AAGTAGTTAG TGTATTTATA TAAATTCTTA 2220 
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acgagtgtaa ccaccttgac gttctgtgta acgctctgcg atttcaccaa ataatttttg 2340 

aagtgcagtt tgtgtagttt catcttcgtt taagatttca acattacgta aagttttagc 2400 

tgcattacga cgagaagcta aatctccttt tttacctaaa gtgattaatt tctcaacaac 24 60 

actgcgaact tcttttgcac gagcttctgt agtttcaata cgttgactaa taataagtga 2520 

tgtaggtaag tcacgtaaca tagctttacg ttgatcagaa gtacgaccta attttctgta 2580 

acccatgagt taacctcctt tatcaatctt cttttcttaa tcctaatcct aaatcttcta 2640 

atttgtattt aacttcttct aaagatttac gacctaaatt acgcactttc atcatgtcag 2700 

cttcagattt gtcagctaac tcttgaacag aattgattcc tgcgcgtttt aag cagttat 2760 

atgaacgtac agataagtct aattcttcaa tagacatttc taatactttt tctttttgat 2820 

ci iv itct tt ttcaatcatg atttcagcgt tttgcgcttc atcagtaaga ccaacgaaga 2880 

tattcaagtg ttcagtcatt atttttgctg ctaatgaaac tgattcttgt ggtgtgattg 2940 

AACCATTAGT ccaaacatcc AATGTTAATT tatcaaaatc ACTGCTTTGA CCTACACGTG 3000 

TATTTTCAAC AGTATAGTTC ACACGTTCAA CAGGTGAATA CAATGAATCA ACAGGGATTA 3060 

CACCAATTGG TAAATCACTA GTATTATTTT GTTCTGCTAA TGCGTAACCT CTACCCTTGT 3120 

TAGCAACTAG ACGAATTTTT AAGTGACCAC CTTTAGATAC TGTTGCAATT TTAAGCTCTG 3180 

GGTTTAAAAT TTCAACATCA CTATCATGTG TAATGTCGGT TGCTGTTACT TCGCCTTCAT 3240 

CACGTACATC AATTTCTAAA GTTTTATCTT CTTCAGAGTA AATTTTCAAT GCTAATTGTT 3300 

TAATGTTCAT AATAATTGTA GAAACATCTT CAACTACATT GTCTACTGCT GAGAATTCAT 3360 

GTAAAACTCC CTCAATTTCA ATATACTTAA cGGCTGCACC TGGTAATGAA GATAGTAGGA 3420 

TACGACGTAA GGAGTTTCCT AGTGTAGTAC CGTAGCCACG TTCTAGTGGT TCAACAACGA . 3480 

ACTTACCGAA TTTAGCATCT TCACTAATTT CAATTGTCTC AATTCTAGGT TTTTCGATTT 3540 

CTATCATTTA AATATCCTCC TTATATACGT CGACTTAATT TAAAATGTTT GCTCAGTGAC 3600 

CTGTAACAAT ACCATCATAA ATTATACACG ACGACGTTTT GGTGGACGAC AACCGTTATG 3660 

AGGTACTGGA GTAACGTCTC TGATCGCAGT TACTTCTAAA CCTGCAGATT GTAATGCACG 3720 

AATAGCTGAT TCACGACCTG GACCAGGTCC TTTAACTGTT ACTTCAACTG TTTTTAAACC 3780 

ATGCTCCATA GCTGATTTAG ATGCAGTTTG AGAAGCCATT TGTGCTGCAA ATGGTGTTGA 3840 

TTTTTTAGAT CCTTTGAATC CTAATGCACC AGCTGATGAC CATGATAAAG CATTACCGAA 3 900 

CTCATCAGTG ATAGTTACAA TAGTGTTGTT GAATGTTGAA CGGATGTGTG CTACACCATT 3 960 

TTCAATATTC TTTTTCACTC TACGTTTAOG AGATACTTGT TTACGTGCCA TTTAAAATTT 4020 
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CGCGCGTkGT TTTTCGTTTT TTGAGCACGA ACTGGTAAAC CACGACGGTG ACGGATACCc 
ACGGTATGAT GAAATTnCCA TTAAAcGTTT GATATTTAAG TTAGTTTCAC GACGTAAGTC 
ACCTTCGACT TTATAACCGT CTACAACTTC ACGGATGCGA CCTAATTCGT CATCAGTTAA 
ATCTTTCACA CGAGTATCAG CTGATACGTT AGCTTCTTCA AGAATTTTTT GAGCAGTTGA 
CGTACCGATA CCGTATATAT AAGTTAATGA GATAACTACG CGTTTTTCAC GTGGAATATC 
TACTCCTGCA ATACGTGCCA TATTAATTTA CACCTCTCTT TTATT AACCT TGTCTTTGTT 
TGTGTTTTGG ATTTTCACAA ATTACCATTA CTTTACCTTT ACGTTTAATG ACTTTACATT 
TTTCGCAAAT AGGTTTTACT GATGGTCTTA CTTTCATTTT TATACCTCCC TATATTATGG 
AGTGACGATT ATTTATAACG ATAAGTAATT CTTCCGCGTG TTAAATCGTA CGGAGACATC 
TCAACAGTTA CTTTGTCGCC AGGTAGAATA CGAATGTAAT TCATTCTGAT TTTAC CACTT 
ACGTGAGCnA AAATCTCATG ACCATTTTCT AATTCTACTT TAAACATTGC GTTCGGTAAA 
GTATCTAATA CAGTACCTTC TAATTCAATT ACATCTTGTT TAGCCATTGA TTAACTTCCC 
CCTTTTTGCA AT AGT AAGGT AATCGTCAAT AGACAACTTT ATTGTTACGA ATCTATCAGT 
GATTAATTTT ATAAGTTAAA CAAAAATTAC GGGAATTAAT TATCGTTAAT TGCCACTCTC 
ATCTATCTAA TATGATTAAA TCATGCCTCA CTTAAAATAG ACCGCTAAAA GTTGATCTAT 
TACAAATGAT CTAAAATATC AATGACATCT TTGGTAACGT CGCTAATATC TTTTGAACCA 
TCAATATTTT TCAATACACC TTTTTGATCA TAGAAATCTA AAATAGGCTT AGATTGTTTA 
ATATTAACAC TCAAACGATT AGCTACCGTT TCAGGATTAT CATCTTCTCG TTGATACAAT 
TTACCACCAT CGATATCACA AATACCTTCG ACTTCGGAGG jATTAAATACA AGATGATACG 
TTGTACCACA TGACTCACAG ATTCGACGAC CTGTAAGACG GTTCATTAAT TCTTCTTCCG 
GAAdTCGAT ATTGATGACA GCATCAATGT TTCTGTCAAG CTCAGACATA ATATTATTTA 
ATGCCTCAGC TTGCTCGATT GTTCTTGGGA AGCCATCTAA TAAAAAGCCT TTTTTTGCAT 
CGTCTTCAGA AATTCTTTCC TTAACGATAC CTACAGTCAC TTCATCAGGA ACTAATTCGC 
CACGGTCCAT ATAAGACTTA GCTTCTTTAC CTAATTCAGT TTCTTCTTTT ATAGCTTTTC 
TGAACATGTC ACCAGTTGAA ATGTGGGGTA TTGGGAATTT CTTGaCAATT TCACTTGCTT 
GAGTTCCTTT ACCTGCGCCA GGTAAACCCA TCAAAATGAT ATTCATAAGT GCCCTCCTAA 
AATTATCTAC CACCAAAGCC TTTATATTCT TTTTGAGATA CTTGAGCTTC TAAAGATTTC 
ATTGTTTCAA TCGCTACACC AATAACGATA AGTAAACTTG TACCACCAAT CTGAATTGAT 
TGTGGTAATC CCATAAACTT AGTTGCTAAT ATCGGTAGAA TTGAAATAAC GGCTAAGAAG 



925 



CCAGGTCTAA TACCTGGAAC ATAGCTACCT 
GGATTAACTT GTACAAATGC ATAGAAGTAT 
5 ACCATACCAA CATTACTTGA AGGATTTGCA 

TCTGGATAGA ACAACGTTAA TGTTCTAGGC 
GGAATAACAC CGGCTGAGTT CACTTTTAAA 

10 

TGAGCAGTTT GTTTCTTAGC ATATTGAATC 
ATAGCACCTA CAGTTAATAG TATCAGTGAC 
AATGATGTAT CTTCTTGCCC AACGAACGCA 

15 

ACGTTGATAA AATACCCGCA AATATGATAA 
TGATTTGATC ACCAAGCCAT ATTAAGAAAG 

20 AATAAATAAC TCATAATTGA CTGATTGATA 

TGGAATGCCA TACCTATAGA TTGGATAAAT 
TTATTTAACT TTCTTCTACC TACTTCACCT 

25 ATATCCATTT GTAATAATTG CATTACGATT 

GCAAAAATAG AAAATCGTTT cAAGGCTCCG 
CCTTGAGAAC CTTGGGGATT ATCAAAAGCT 

30 

GTCCCTATTT TAAAAATTAC TAACATTGCT 
TTTGTTCTAA AGAAGTTCAC AAGGGTTTGA 
TAGCATCAAT AGCTTCTGCT GCTGAAGCTG 

35 

TATCAAGTGA ACCATTACCT AGTATTTTGA 
ATTCTACTAA TAAAGCTGGA GTTACTTCAG 

40 AGTTAACAAT AGCATATTCT TTACGATTTA 

GGAATAATGG T AATTG AC CA CCTTCAAATC 
TTTGACCTTT GTGTCCGCGA CCACTTGTTT 

45 CACGATTGCG TTCTTTACGT GAACCTTCTG 

CACCTCCTTG ATTATTTTTC TTCTACTGTT 
CGAATAGCAG GGTTATCTTC AACAACTACT 

50 

TCAACAGTTT TACGTTGTGT TTCAGGACGA 
AATTTAGCCA TAACTAGTTT TCCCTCCTTA 
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TGTTTCTTAA GGTTATCAGC CATTTTTTCC 5940 

GTGAATAGTA TAATTAGTAC AATATATACA 6000 

GCATTCGCAA TGTTTTGTGC CCATTCTTTA 6060 

AGTAAGAAGA ACGCCATTGC AAAGATTACA 6120 

GGTAGATAAG TTGCCTGTGA AC CT AATCTT 6180 

GGAATTTTAC GAACGGCTTC AAGTACATAA 6240 

ACTAAAAGTC CTAATACTTT CAACCATGCT 6300 

tTTGTcCAAA TTGAATTAGA CTGGCTGGCA 6360 

TAGAAATACC ATTACCAACA CCGAACTGAG 6420 

CAGTTCCTGC TGTnCAAAAC TAGTGCTATT 6480 

ATCAGCGCAC CTTTGAGATA ATTATTAAAT 6540 

GCTAAAGAAA TTGCTAAATA ACGAGTAACG 6600 

TGTTTTGCCC ATTCTGAGAA TTTAGGGACA 6660 

GATGCAGTGA TGTAGGGTAC AATACCCATT 6720 

CCACCAAAAG TATTTAATAA CTCAGTGGCA 6780 

GCAGGATTTA CTCCTGGAGC TGGTATATAA 6 840 

AGTGTGAAGA AAATCTTGTT ACGAACCTCT 6900 

ATCATTAGAT CACCTCGTGT GcTCCACCTT 6960 

AGAATTTATG AGCTTTCACT GTCAATTTCT 7020 

TACCAGATTT TTCATTCTTA ACAACACCAG 7080 

TACCATCTTC AAATTTATTA AGTTGGTCTA 7140 

TGTTAGTAAA ACCACGTTTT GGTAAACGAC 7200 

CTGGTCTTAC ACCACCGCCT GAACGAGCTT 7260 

TACCGTTACC TGTCGCAACA CCACGTCCAA 7320 

CCGGTTTTAA CTCATGTAAT TTCATTTCGG 7380 

ACTAAGTGCT TAACTTTGTT GATTTGCCCA 7440 

GAACTGTTAG TCTTTTTAAG ACCTAAAGCT 7500 

CCAATAACAC TACGAGTGAG GGTAATTTGT 7560 

ATTGTATAAT TCTTCTACTG TTTTGCCACG 7620 
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CATGTTGATT GGTGTGTTTG ATCCTAATGA TTTACTTAAG ATATCAGTGA 


TACCTGCTAA 


7740 




TTCAAGTACG 


GCACGAACAG GACCACCAGC GATAACTCCT 


GTACCAGGTG 


CAGCCGGTTT 


7800 


5 ' 


CATAAATACG 


CTTCCTGAAC CGTAACGGCC AGTAATTGTG 


TGTGGAGTTG 


TACCTTCAAC 


. 7860 v 




ACGTGGAACA 


ACTACTAAAT CTTTTTTAGC TGCTTCAAGA 


GCT'l"r , l"l"lX3A 


TTGCTTCTGG 


7920 




TACCTCTTGA 


GCTTTACCAG TACCGAAACC TACACGACCA 


TTTTTGTCTC 


CAACTACAAC 


. 7980 




TAATGCAGTG 


AAACGGAAAC GACGACCACC TTTTACAACT 


TTTGCTACAC 


GGTTGATTGT 


8040 




AACAACGCGT 


TCTTCAAATT CTTTCGTCTC TTCTTCtCTA 


CGAGCCATGT 


ATTTGTCCCT 


8100 


15 


CCTTTAAATT AAAATTCTAA TCCGCTTTCT CTTGCTGCTT 


CAGCTAATGC 


TTTAAcACGT 


8160 


CCGTGATATA 


AATATCCTCC ACGGTCAAAT ACGATTTCTT TAATGCCTTT 


GTCAGCAGCT 


8220 




J» .L ^ X >M^»*^ 


TTGCTTCACC GACTTT AGTT GCTAATTCAA 


CTTTAGTTGC 


TGTAGTAGCA 


8280 


20 


ATGTCGCTGT 


CTTTTGAAGA AGCTTGAGCT AATGTTACGC 


CTTTATTATC 


ATCAATAATT 


8340 




TGAGCGTAGA 


TATGCTTGTT TGAACGATAT ACGTTTAAAC 


GTGGCTTTTC 


AGCTGTACCT 


8400 




GATAAGTTAG 


TACGAACACG AGCATGTCTT TTTAAACGCA 


CTTTATTTTT 


ATCAATTTTA 


8460 


25 


CTGATCATTT 


CAATACTCGT TTGTTTAGAG TTTATCTATT 


ATTTACCAGT 


TTTACCTTCT 


8520 




TTACGGCGAA 


CGTATTCACC TTGGTAACGA ATACCTTTAC 


CTTTGTAAGG 


CTCTGGAGGT 


8580 




CTTACTGAAC 


GGATGTTAGA TGCTAATGCT CCAACTTGTT 


CTTTTGAAAT 


ACCTTCAACT 


8640 


30 


TTAACGACTG 


TGTTTTTCTC AACTGAGAAA GTAATGTTTT 


CTTCAGCTTT 


AATTTCTACT 


8700 




GGGTGAGAAT 


AACCAACGTT AAGGATTAAG TCTTTACCTT 


GCATTTGAGC 


ACGGTAACGT 


8760 




ACACCAACAA 


GTTCAAGTAC TTTTACGTAT CCTTGAGAAA CACCTTGTAC 


CATATTGTTT 


8820 


35 


AATAAAGCAC 


GAGTTGTACC ATGGTTTGTT CTATCTTCTT 


TAGAATCAGA 


TGGTCTTACA 


8880 




ACTTeAATTG 


TGTTTTCTTC TTGTTTGAAT GTCATTCTTT 


CATTTAAAGT 


TCTTGATAAT 


8940 


40 


TCACCTTTAG 


GACCTTTAAC AGTTACATGA TTTCCATCAA 


AAGTTACTGT 


TACGTCA.CTA 


9000 


GGGATGTCAA 


TAATTTTCTT ACCAACACGA CTCATGTTAT 


GGCACCTCCT 


TA'rrrrrrAT 


9060 




TACCAAACGT ATGCGATAAT TTCTCCACCA ACATTACGTT 


TTCTTGCTTC 


TTTGTCAGTG 


9120 


45 


ATTACACCTT CAGAAGTTGA TACTAATGCA ATACCTAAAC CATTTAATAC 


TTTAGGCATT 


9180 




TCGCTAGCTT 


TTGCATAAAC ACGTAAACCT GGTTTTGAAA 


TACGTTTTAA 


TCCTGTGATA 


9240 




ACACGCTCAT 


CGTTTTGACC ATATTTTAAG AATAAACGAA 


GTACACCTTG 


TTTATCATCT 


9300 


50 


TCTACGTATT 


CAACATTTTT AATGAAACCT TCACTCTTTA AGATTTCAGC 


AATTTCTTTT 


9360 




TTAATATTTG 


ATGCAGGTAA TTCTAACTTC TCGTGACGCA 


CCATGTTTGC 


GTTTCTTACA 


9420 
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TCTTTTTTAT TACCAGCTAG CTTTACGAAC GCCAGGGATT TGGCCTTTGT AAGCTAATTC 9540 

ACGGAAACAA ATACGGCATA ATTTAAATTT ACGATATACA GAATGTGGAC GGCCACAACG 9600 

TTCACAACGA GTGTATTCAC GAACTGCATA TTTTTGTTTT TTTTGTTGCT TAGCAACCAT 9660 

TGAAGTTTTA GCCACTTAAT TAGCCTCCTT TAAATAATTA TTTACGGAAT GGCATACCGA 9720 

AGTTAGCTAA CAATT CACG A GCTTCTTCAT CAGTGTTAGC AGTCGTTACG ATAACAATAT 9780 

CCATTCCTCT AACTTTACTT ACTTTATCAT AGTCGATTTC TGGGAAAATT AATTGTTCTT 9840 

TAACACCTAA AGTGTAGTTA CCGCGTCCGT CAAATGCTTT TTTAOAAACA CCTTGGAAGT 9900 

CACGTACACG TGGTaATGAT ACTGAAATTA ATTTGTCTAA GAATTCATAC ATTCTTTCAC 9960 

CGCGAAGTGT TACTTTCGCA CCGATTGGCA TACCTTCACG TAAACGGAAA GTCGCGATTG 10020 

aTTTTTTAGC TTTAGTTACT AATGGtTTTT GACCAGTGAT CAATTCTAAT TCTTCAACAG 10080 

CATTGTCTAA TACTTTAGAA TTTTGTACTG CGTCACCTAC ACCCATGTTC ACAACGATTT 10140 

TATCTATTTT TGGTACTTCC ATTACTGAAC TATAATTGAA TTTTTTCATT AAGTTTTCAG 10200 

TAACTTCAGT GTTaAACTTT TCtTTTaAAC GGTTCaAAGT GGGATCCTCC TTTCaACTTG 10260 

T t ATTAATT A TTAGAkTTAA TTTCTTCGCC AGATTTTTTA GCGATACGAA CTTTTTTACC 10320 

ATCAACAAAT TTGTAACCTA CACGAGTTGG TTCGTTTGTT TTAGGGTCCA ATAATTGTAC 10380 

ATTAGAAACA TGGATTGCTG CCTCTGTTTC TAAGATTCCA CCTTCAGGAT TTAATTGAGT 1044 0 

TGGTTTTTGG TGTTTTTTCA TAATGTTAAC ACCTTCCACA ACGACACGGT CTTTTTTAGG 10500 

TAGAGtAGCA ATTACTTTAC CTTCTTTACC TTTGTCTTTA CCTGCGATAA CTTTAACGTT 10560 

GTCACCTTTT TTGATATGCA TGTGGGCACC TCCTTATTTG TATTGGTTGT TATTAATTAA 1062 0 

AGTACTTCTG GTG CTAATGA TACGATTTTC ATGAAGTTAC CTTCACGTAA TTCACGAGCA 10680 

ACAQPTCCGA AGATACGAGT ACCACGTGGG CCTTTGTCAT CACGGATGAT AACACATGCA 10740 

TTTTCATCAA ATTTGATGTA TGAACCGTCA TTACGACGAA CACCTGACTT AGTACGTACG 10800 

ATTACAGCTT TGACAACGTC ACCTTTTTTA ACAACGCCAC CTGGTGTTGC ATTTTTAACA 10860 

GTACATACGA TAACATCGCC GATGTTTGCT GTTTTACGAC CAGATCCACC TAATACTTTG 10920 

ATTGTAAGAA CTTCACGAGC ACCAGAGTTG TCTGCTACTT TCAAGCGTGT TTCTTGTTGG 10980 

ATCATTAGTT AAACCTCCCT TATCTCTAAA CTTGTATTAA ATAATTACTG ACTCTTCAAC 11040 

AATCTCTACT AAACGAAAAC GTTTTGTTGC TGATAAAGGA CGAGTTTCTT GAATTTTAAC 11100 

AATGTCTCCT AATTTAGCTG AATTGTTTTC ATCATGAGTT TTGTATTTTT TAGAGTATTT 11160 

TACTCGTTTA CCGTATAATT TGTGTGTTTT GTAAGTTTCA ACAAGTACTG TAATAGTCTT 11220 
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TTTTGTAACC 
CGAGCAACAG 
TCtAATTGAC 
ATTTGTTCTT 
ACCACCCAAT 
ACGTAGTGcT 
TGGTTTAACA 
TAAAGGTTTT 
TTTCATGTAA 
CGTTGTTGTA 
CCAGTTGTTT 
ATTTTCCTCC 
TAACGCCTAA 
GTAACGTATG 
. CGCCTAAACG 
TGATTGCTTG 
TTTCAGCTAC 
CTTTTTTATC 
TACCAATTAC 
GTTCAATCTC 
TTTTTAAATC 
AATCACGGAT 
CTCCTTAAAA 
AATGTGGCTT 
TTTTAATGTT 
GTCATAGTTA 
TGAAGCTTTG 
TAAGTCAAGA 
TGCTTCCATT 



TCCTCTTACT 
TTTTTAGACG 
CTGTAGCTAA 
CGATTTCTGA 
TCCTCACGTT 
TCACGCGCAA 
ACTGCGATCC 
TTAGTATATG 
CGTGTCATTG 
GCTTGTAAAC 
TAGGACGATG 
TCCACTAGTG 
TTTACCGTAA 
AAGTGGAACA 
ACCAGATACT 
TTTTTGTACA 
TAAACGAGCG 
AGTTAACGCA 
CATACCAGGT 
TACGTGAGAA 
TTCGTGTAAA 
AATACCAACA 
GTTAATTAAG 
GTACGTTTGT 
GGTCCTTCGT 
TGTTCAGCAT 
TTTGTTAATT 
ACTAGTCTTA 
AGGATGTCCT 



TAATTATTGA 
TGCAATCGTT 
CTGAAAGCGT 
AGTGGTTAAG 
TTACAAACTT 
CTTCTTCAGA 
AGC CTTCAAC 
GTGTATGTGG 
CTATACGAGC 
CAAACTCACC 
TTGACGACGA 
TTCTTAGTAG 
GTAGTGTCAG 
GTTCCTTCTG 
TGaGTTTTGA 
CGACGGAATG 
TCAAGATCAA 
TTTAATTTGT 
TTACCAGTAT 
ACTGATGCTT 
AGTGAAGOGA 
CGAAGTCCGA 
CTTCTTTAGC 
TAATCGCACT 
TAGCATATGC 
TAGCTAAAGC 
TTAAAATTGC 
CTTTACGAGG 
CCTCTACTTA 



TTAGCCTTAC TTTGTTCAAT 
TTTCTTACTG TACGAATACG 
AGGTTAAAAA GCTCTTCTTT 
TCTCTAATTT CCTTAGCTTT 
AGTTTTTACT GGAAGTTTGT 
AACGCCAGCA ACTTCGAATA 
CGCACCTTTA CCAGCACGCA 
GAAGATTTTA ATCCAAACTT 
AGATTCGATT TGACGAGATG 
AAATGTTACG TAtTACCGCC 
TATTTTACAC GTTTTGGTAG 
GAAGAACTTC TCCACGATAA 
CTTCAGCGTG tGCATAATCG 
AATATTGTTC AGCACGAGCG 
TACCTTTAGC ACCAAGTTTC 
AAGCACGGTT TTCTAATTGA 
CTTTTTTGAT TTCAATTACG 
TGCGTAATTT TTCGATTTCT 
GAATTGCAAT GTTGATACGG 
CTTTTAATTC ATTATCAATA 
AGTCTTTTTC AGCATACCAT 
TTGGATTAAT TTTTTGACCC 
TTCTTCTTTA CCGTCACTTA 
TGCACGACCT TGCGCACGTG 
TTCTTTAACT ACTAATTCAT 
GGACATTAAT ACTTTTTCAA 
AATAGCTTCA GCAGCATTTT 
TGCGATTCTT ATTGTT CT AG 
ATAGATATTA TCTTCTTGTT 



TTCTCTTTCA 
TGCAGTTTCT 
TGAAGATTTG 
CATTTGTTTC 
GACTTGCTAA 
AAATTCTACC 
TACGTACTTC 
TCCCGCCACG 
TGATCCAAGA 
TTTAGAACGA 
TAACATTATT 
ATCCATACTT 
ATGTCAGCAC 
ATGTCAGCTC 
ATAGCTCTAG 
CGTGCGATGT 
TTGATGTGTA 
GAACCGCCTT 
TTTGCAGCAC 
AATTTACGGA 
TTAGCTTCCC 
ACAGTATTCC 
CGACGATTGT 
GACGGAAACG 
CTGTGTTCAT 
TTACTGGTGA 
TACCTCTGAT 
CAACCGCTTT 
TTCTTGTCGT 



.11340 

11400 

11460 

11520 

11580 

.11640 

11700 

11760 

11820 

11880 

11940 

12000 

12060 

12120 

12180 

12240 

12300 

12360 

12420 

12480 

12540 

12600 

12660 

12720 

12780 

12840 

12900 

12960 

13020 
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TATCTTCAGT TACATATACA GGTACGTGTT TACGTCCGTC GTATACTGCA AAAGTATGTC 13140 

CGATGAAATT AGGGAAAATT GTAGAACGAC GTGACCATGT TTTGATTACT TGTTTCTTTT 13200 

CGCTTCCTTC TTGAGCTTCA ACTTTTTTCA TTAAATGCTC ATCGACGAAA GGTCCTTTTT 13260 

TAATAGTACG AGCCATTTGG GCGCCTCCCT TCTTATTATG TGCGTGCAGC TTTAAGCCGC 13320 

ACACCCAAAT AAGTTGATTA TATTATTTTT TCTTACGTGC ACGAACGATA AGTTTGTCTG 13380 

ATGATTTTTT ACCACGACGA GTTTTCTTAC CAAGCGTAGG TTTACGCCAT GGTGACATTG 13440 

GAGATGGTCT ACCGATAGGA GCACGACCTT CACCACCACC GTGTGGGTGA TCGTTAGGGT 13500 

TCATTACAGA ACCACGAACT GTTGGACGGA TACCTTTCCA TCTTGAACGT CCGGCTTTAC 13560 

CAAOGTTAAC TAATTCGTGT TGTAGGTTAC CAACTTGACC GATTGTAGCA CGGCAAGTAG 13620 

ATAAGATCAT AOGAACTTCA CCAGATCTTA ATCTGATTAA TACGTATTTA CCTTCTTTAC 13680 

CAAGTACTTG AGCACTTGCA CCAGCTGAAC GAGCGATTTG TCCACCTTTA CCAGGTTTAA 13740 

GCTCGATGTT GTGTACTACT GTACCAACTG GAATGTTTTG TAATGGTAAT GCGTTACCAA 13800 

CTTTGATGTC AGCTTCAGCA CCACTTTCAA GGATTTGACC TACTTCTAAT CCTTTAGGAG 13860 

CAATGATATA TCGTTTTTCA CCGTCTGCAT ATACAACTAA AGCGATGTTT GCTGAGCGGT 13920 

TTGGATCATA TTGAATAGAA TCAACTTTTG CATTGATACC ATCTTTGTTA CGTTTGAAAT 13 980 

CGATAACACG GTATTGACGT TTGTGTCCAC CACCATGGTG TCTTACAGTC AATTTACCTT 14040 

GGTTGTTACG TCCCGCTTTT TTCGGTAGCG GTTTTAATAA TGACTTTTCA GGTGTAGTTT 14100 

TCGTGATTTC TGCGAAATCT AACGAaGTCA TATTACGACG ACCATTTGTT ATTGGCTTAT 14160 

ACTTTTTAAT AGCCATTGTC GCTTACCTCC TTAATGGTAA TTGTTTTATT AGTTAAATAA 14220 

GTCGATTGAT CCTTCTTTAA GAGTTACAAT CGCTTTTCTT CTTTTGTTTG TATAGCCTTG 14280 

GTAACGGCCC ATACGTTTTT TCTTAGGTTT GTAATTCATG ATATTAACAC TTGCAACTTT 14340 

TACGTTGAAG ATTTCTTCAA CTGCCATTTT TACTTGTGTT TTGTTAACAC GAGTATCAAC 14400 

GTCGAAAGTG TATTTGTCTT CAGCCATTGC TTCAGAAGAT TTCT CAGTGA TTACGGGGCG 14460 ' 

CTTAAGAATA TCTCTTGCTT CCATTATCCG AGCACCTCCT CAACTTTTTT AGCAGCAGCT 14520 

TCAGTAATTA CTAAGCTGTC AGCATTAGTG ATATCTAAAA CATTTAAACC TTGAGCAGTT 14580 

GTCACTTGAA CGCCAGGGAT GTTGCGTGCT GATAATTCAA CATTTACATC TTCGTTTTCA 14640 

GTAACTACTA ATACTTTTTT AGGTTGTTGT AATGTAGATA ATACATTTTT GAATTCTTTA 14700 

GTTTTTGGAG CTTCGAAGTT GAATGCGTCA ACTACAGTTA AG CCATTCTC TTGAGCTTTG 14760 

AAAGATAATG CTGAGCGTAA AGCTAAACGA CGCATTTTCT TAGGCATTTT GTATGCATAA 14820 
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CCTTGACGAG CACGACCTGT TCCTTTTTGC TTCCATGGTT 
GCTGAACGAT TCTTAACAGC ATGCGTACCT TGACGTAATG 
GCTTCGAATA AAACGCTATT ATTTGGGTCA ATACCGAATA 
GAACCTGATT TAGTTCCGTC TAATTTTAAA ACATCATAAT 
CTTTCACTTC TTATTATTTA TTACCTTTTT TAATTGAAGT 
TTTTAGGTCC AGGTACGTTA CCTTTTACTA AGATAACTTT 
CTACTTCTAA GTTTTGAACA GTTACAGTGT TTCCACCCAT 
CTTTAAATAC TCTAGAAGCA TCTGAAGCCA TACCTACAGA 
GAGAACCGTG TGACATAGGT CCACGAGATT GTCOGTGGCG 
CTTTACCTTT TGATACGCCT GTTACGTCAA TAACGTCGCC 
AGACTTCTTG AaCCTAcTcG TAAGCATCCA CGTCTACATT 
GCTTAGGTGC TGCGTCAGCT TTTTTAGCGT GACCTTCAGC 
TAGATTTTGC ATCTTTTTTG TATGCTTTTT TGTCTTCAAA 
ATCCATCAAC TTCTACAGTT TTCTTTTGTA ATACAACATT 
TTACAGGG AT TAATTCACCG TTTTCTCCGA ATACTTGTGT 
AGATTCCTTT GGTCATCGAA AGTCCACCTC CTAAAATTGT 
TGTCTACACC AGATGGTAAG TTTAAGC CCA TTAAAGCGTC 
TTACAATATC GATTAAACGT TTGTGTGTAC GTTGTTCGAA 
ACTTATGCAC GGCACGGATG ATTGTGTAAA CTGATTTCTC 
CAGAAACATC TGCACCAGAA CGTTTCGCTG TTTCTACAAT 
TTACSCGGTG ATCATAAGCT TTTAATCTGA TTCTGATTTT 
CTCCTTATTC GTCTACATTT AGTGATAGAC TTCTCCACGA 
ATGGCAAAGC GGCCGGGTGT GTCAGTAACC TTTCGCTTCA 
CGTTAGTTAT ATTACACGAA AAACATCGAT AAATCAAGGC 
CTGTCTAACA CATACTTTTA TATTTnACTT TATATACTTA 
GATATTTTnA ATTTCCn 

(2) INFORMATION FOR SEQ ID NO: 206: 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 29555 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 



TACGTCCGCC 
AAGCACGTTG 
CTGCATCGCT 
TAGCCATTAT 
TCTGATTTCT 
GTTTTCTGTG 
ACGTCCTGGC 
ACCTGGTGCT 
TTTAATTGCA 
AGCTACAAAA 
GCGGAATTCA 
TGGTTTATTA 
TCCAACTTGG 
TTCTTTAGCT 
CATCCCAATT 
CTATTATAAT 
AACTGTTTTT 
TTGTTCACGT 
AGTTGGTAAC 
CTTCTCTGCT 
TTGTTTTGCC 
AAACTATCTT 
TCGCTTTTCT 
TTTTCACATA 
GTCAGTTCAA 



ACCGCTTACT 
TAAATTAATA 
TAATTCGATT 
GCATTTCCTC 
ACTAAACCTT 
TCAACTTGAA - 
ATTTTTTGGC 
CTGTGGAAAT 
CCTTGGAAAC 
GTATCTACTG 
CGAATGAAGC 
GCATATTTAT 
ATTGCGTTGT 
TCTACTACTG 
TTTCTTCCTA 
TTGATTTCGA 
GGTGTTGGGT 
GAATCTTTAT . 
GGAATTGGTC 
GATTGATCAA 
ATAATTTTCC. 
ACACAGCGCC 
TAAAGTCCAA 
ATTTTTCTAT 
CTATTTTCGA 



14940 
15000 
15060 
15120 
15180 
15240 
15300 
15360 
15420 
.15480 
15540 
15600 . 
15660 
15720 
15780 
15840 
15900 
15960 
16020 
16080 
16140 
16200 
16260 
16320, 
16380 
16397 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 206: 

TnAGTTGTTT CTGCCACGAA AG ATTCAATG GCTTTTCTTG CTTTACGCTT TTCTTTCAAT 60 

GGCAAATCAC CAATCATTTT TTTAAGGTGA TGTGGGTTTA CAACACCACT ATACTGGTAG 120 

TCATTTGAAn TTGTTTTTAG GGCTTGTTCA TCGATAGATC TCTCTCCAGC AAATCCTTTG 180 

AACTCCGCTT CTTTTTTAAT ACTTTCGAAA TTAACATATT CTTGATCGAT ATCATCATCC 240 

TTATTTAAAG AAGGTACAAC ATTGTCGATG AATTCTCTAA TTAGATCTCG TTTTAACCTC 300 

AATGtCGGAT CATCTGCATG ATCTAAAATG CGTCTAATTT GTTCTTGGTT ACGACGTTGT 360 

TCCGCTTTGT CTTCAAGATC AATTTGTCTC AATATATTCA TAATATAATT CACATTAATC 420 

GTATCATTAC GCATCATTTC TATTTCGAAA TCAATATCAT TTAAAATGGA TACTTTATTT 480 

TTCTCAGCCG TCGCTCTTTT TACTTGATCG TACACAGCTA AATATTTACT TTTATAGTCT 540 

TCATTCTCTT GTTCATCCAT TCCAATTTCA TCAATTGTAA ACTCAAACTC GTCAAATGCT 600 

TTTAAACGTA ATATTATTTT AGCTAATAAA CGATAAGCtT CAACAAAGCG CTTTAGCTCT 660 

TCTTCATCCT GaATG t CATC AACCATGTGT GGTGTCGGCA CAATCATTTT AAGCTCACGA 720 

TAAGCGTCCA TAAATTCTTT TTTATACTCT TCATAACTGC GCATTAAAAT TGTATCCGTA 780 

TCATTTGTTT GTGAGAATAC TCTCAGTGCA TCGTCTGTCT CTTTTTTCAA GTCACGATAG 840 

TTTACAATTT TACCAAATGG CTTTGATTCT TTTTCAACCC TATTTGTACG TGAATACGCT 900 

TGAATTAAAT CATGATACAT TAAATTCTTA TCAACATATA AAGTGTTCAG TACTTTACTA 960 

■ y 

TCAAAACCAG TTAAGAACAT ATTAACAACG ATTAAGATAT CAATTTTACT ATCTTTAACG 1020 

CCCTTTTTAA CGTTTTTtGA AATATGATTA AAATACTCAT TAGTTGtGGC TGnTGaAAAA 1080 

TTCCTCTCGA ACTTTTTATT ATAATCACTA ATCATTATCT CTAATTTTTC ACGTGAATGA 1140 

TATGGCACTT CACCATCACG ATCATCTTCA TTAGGTTTAA ACGTAAATAT ACCAGCTATC 1200 

GTTAACGGTT GTTCCAACTT TTTGTTAAGT CGCTTAAATG TCTCATAATA TTTAATAAGC 1260 

GCGTGAATAC TTTGGACTGT AAATATACTT GAATATTGAC GATTACGTGT ATATTTATCA 1320 

TGATTATTGA TGATATGTCG TGTTACT AAT TCCACACGTT TATCCGCTAA CCATACTTCT 1380 

TCCGTATCAA TTGCTTCAAC CATGCtGTTA TCTTCTGCTT TTAAAGCTTT ATTTTTAAAA 1440 

GTATTAATAT AGTCAACTGA GAAACCAAGT ACATTACCAT CATGAATGGC ATCTCTAATT 1500 

AAATACGTAT GTAAGCATCT ACCGAAAATA TCTGCAGTTG TTCTACCATC TTGACTACTA 1560 

TTTTCTGGAA AACGTGGCGT ACCAGTGAAT CCAAAGTATT GGGCATTTTT GAAATGTTGT 1620 
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ACTTTATTCG TTTTATACTG TTCTAATAAA GGGGCATTCC CTTGAATCGC TTTAGCCATT 1740 

TTTTGAATCG TCGTTACAAT AAGTGGCAAA CTTTTATCAT TTAGTTGGCG TACCAGTTGC ,1800 

GAGGTATTAA AAGTTTTGTC TACAGCACCC TTAGCAAATT . TATTAAATTC CTCTTCTGTT 1860 

TGACTATCCA AGTCTTTACG GTCAACCAAA AAGATAACTT TCTTAATGTC ATCTTGCTGT 1920 

GATAAAATCT GACTCGCTTT AAAAGAAGTC AACGTCTTAC CACTTCCAGT TGTATGCCAT 1980 

ACATATCCAT TATTCCCTGT CTCAGTCGCT TGTTGAATAA GTGCTTCTAC CGCATACACT 2040 

TGATACGGAC GCATTGCCAT CAGTATTCTA TCTGTTTCAT TAATAATCAT ATAGCGCGAT 2100 

ATCATCTTAG CTAATTGACA AGGTCTCATA AATGACTCAG CAAACGATTG CAATGTATTG 2160 

ATACGGTTAT TCTGTTTATC ACTCCAATAA AACATGTGAC TCTTCAATAG TTCGCTATCA 2220 

TTATTAGAAA AGTATCGCGT TTCAACACCA TTACTAATGA TAAACATTTG TATGTAGCGG 2280 

AATAAGCCTG TGTAATTTTG TTTGCGGTAA CGTTTTACTT GGTTAAACGC CTCATTAATA 2340 

TCAATACCTC GACGTTTCAA TTCAACTTGG ACAAGGGGTA GTCCGTTGAT TAATATCGTT 2400 

ACAT CAT AAC GTGCTTTATA TGTATCCTCG ACAGATACTT GATTCGTCAC TTGAAACTTA 2460 

2S TTTTTACACC AACTTTTCGT ATCTAAAAAC GACAAATAAA TCTCAGACTC ATCATCACGT 2520 

CTAAGTGGTA ATTTATCACG TAAAATACGG GCACTGTCGA AAATACTTTT TCCATCAATC 2580 

ATCGTTAACA GACGTTGaAA TTCTTTATGT GTTAaGGGAT TGCCTTCTAA TTTGTCCGCA 2640 

30 TGACGCTCAT TTAAAATCGT TCTAAAATTA TCAAGCAATT GCTTATTATC ACGTATCGTT 2700 * 

ACTCTTTCGT AACCCAATTG TTCAAGTTGA TTCATCATTT CATTTTCTAA TGCX;TATTCA 2760 

CTTTGGTATG CCATTCATAT CCCCTTCCAT ACACTTTCTA TTGCTCTAAA TATATCATAA .2820 

ACTTTAATGA AAAATGTTTG TTTTTTATCT TCAAACGTAA ATTTATTCTA ATTTTATTGT 2880 

CTTAXCTTTT AATATTTGTC TTTGAGGTAA GTCGTATACT AAAATTTGAA TACAAATAAT 2940 

CAAATCATTG ATAAATTTTT TGTCTACGAT TAATGGAGGG ACTTGAATGG TGTTAATTAC 3000 

CTATCAAATC ATTTTATTTT TTATTATTAG TCTAAGTTAC TATTTAACTT TAAATCATTA 306 0 

CATGGCAGTC ACTGTAGGTA ACTTCACTTC AATATTCGGC ATGTTCGCAG CCATACTCTT 3120 

45 TATGTACTAC TACCTACTCT ATAAAAGTCC CGAATACAAT CAACGCAAAC GATTTAAACA 3180 

TTTCATTCAT ATCACTAATT TGATAATAAT TGCTTTTAGC ACCTTCGTAT TAGTTCATTT 3240 

AGCATTAAAA TTATTCTTCA GCATTTAATT TCCATCTATG AAAAAAGCAA AGCTCAAATC 3300 

50 TGAACTTTGC TTTAATTTGT CACGCCTTTA TCATTTTCAA AATAGCCTCT ATGCCAGTTT 3360 

TACAAACTTG TAGCAACAAT TTTTCATCAA GCAACTGAAT CACATCAAAA ACTTCAATTG 3420 
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GTCGCAAGAT 


GCTTCCTGTA 


ATTATCAAGT 


GCCATTTTCG 


ATTGGGTTAT 


ACAATCTAGA 


3540 




AT CGCATGAT 


AATTTAATGC 


TACAAATCGA 


TAGTACAATA 


TATCTACCGT 


GAATAACTGT 


3600 


s 


GCAAATAGTG 


ACGTTGTAGC 


/iy"» /"*y"i m * /™i 

CGCCATACGC 


ATTTCATTTT 


CATCAGTTCT 


GCCATAAATC 


3660 




AATGCATAGT 


CTGCAATTTG 


AGCCACTGGA 


TT ATT AG CTG 


TACTAGATAT 


AGTTATGATG 


3720 


10 


GGAATACTGT 


AATGTGTGGC 


CACCTGTG CA 


ATTGACTGCA 


ATTCACTATG 


ACTACCTTGA 


3780 


TTCGTCACAA 


AAAT CATG CA 


ATCTCTATCA 


TCATGCGTCG 


CAAATGTTGA 


CACAAGTAAA 


3840 




TGCGTTTCAT 


GTAATAACCT 


GACATTTAAG 


CCAATACGAG 


ATAACTTTTG 


AAAAAGATCA 


3900 


1S 


CCAATAGTCA 


AACTCGATGC 


GCCAAATCCA 


AATAAAAATA 


TTGTCCTGGc 


ATTTTTCAAC 


3960 




ACATCACAAA 


TTGCATCAAT 


TTGCGCATCC 


ATAATATTAG 


TAGCTACAAA 


TCGCATCGTA 


4020 




TTCGTTGCTC 


TAGCAATCAT 


tttatttttc 


AAAGTTTCTA 


CAGATTCATT 


TTCAATCAAT 


4080 


20 


TCTAAATGTG 


GATTGGTTGC 


AATATCTTCG 


GGTAAGTATC 


GAGATATCGC 


AATCTTTAGC 


4140 




TCTTGAAAAC 


CTTGATGTGT 


CATTTTCCGA 


CTAAATCTAA 


CAATTGATGC 


TGTACTAACA 


4200 




TTCGTAACAT CTGCCAAATC ATTCACAGTC ATATCAATGA TTTTATGTGG ATTCTTTAAA 


4260 


25 


ATGTAATCAG 


CGATTATCTT 


TTCTGTCTTC 


GTAAAATCAC 


TCAACTGCTT 


ATCAATGCGA 


4320 




TATAAAATAT 


TTGTCATCAT 


TAATCACCCA 


ACAAATCTGT 


CTGTCGCATC 


GCCTTTGTCG 


4380 


30 , 


TTCCAAATAA 


ATATGTACAA 


ACGAATCCAC 


CAGCATACGC 


AGCAAGTAAT 


GCTGCAATAT 


4440 


AACCTAAATA 


CATATTATCT 


GAGATTAATG 


GTAATAGTGA 


CACACCACTT 


GGGCCTATTG 


4500 




CTTTGGCACC 


AATATGTCCA 


ATTCCACCTA 


TTACAGCGCC 


ACCAATACCA 


CCACCAATAC 


4560 


35 


AAGCAGTTAA 


GAAAGGTCGA 


CCTAATGGCA 


AAGTCACACC 


ATAGATTAAT 


GGTTCTCCGA 


4620 




TACCTAGGAA 


ACCAACTGGC 


AATGCACCTT 


TTAAAGTATT 


ACGTAATGTT 


GTGTTGCGTT 


4680 




TACATCTTAC 


CCAAAGTGCT 


AATGCGGCAC 


CTACTTGTCC 


AGCACCAGCC 


ATCGCTGCAA 


4740 


40 


TTGGCAATAA 


GTAAGTAGCA 


CCTGATTGGT 


TAATCATTTC 


TATATGAATT 


GGCGTAAAAA 


4800 




TATGATGAAG 


CCCTAACATA 


ACTAACGGTA 


GGAAGCTTGC 


ACCAATGATA 


AATCCACTAA 


4860 




ATACGCCACC 


AATACTAATA 


ATTCCGTTAA 


CTACTGAAAC 


TAAACTGTGT 


GAAACAAAAC 


4920 


45 


CTGCTAATGG 


CATAAAGATA 


AAGATAGTTA 


ATAGTCCTAC 


AATCAACAAT 


GCAATAGTCG 


4980 




GCGTTACAAT 


AATATCAATC 


GCATTTGGCA 


CAATTTTATG 


TAATCTCTTT 


TCGACAATAC 


5040 


50 


TTAAAATCCA AACGGCAAAA 


ATAACGCCAA 


TAATCCCACC 


TTGTCCAGGT 


TGCAATGGTT 


5100 


CTCCAGTGAA 


GACATTCATT 


AAAATATTTT 


TACCAGCAAT 


ACCCGTTAAT 


AACGTTGTAC 


5160 




CACCAATCAC 


GCCACCAAGT 


CCTGGTGTCG 


CACCAAATTC 


TTTAGCCGCA 


TTAATACCAG 


5220 
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jr» X £\xn\3\~\~ X VJr 


C CACCATTAA 

UwtVVAA Art** 


GTTACTCAGT 


ACTGCTGCAA 


5340 




t* a r* a r 1 & & t 


TAATCHAfiPT 


f CAATAAATG 


CAGGAATCAA 


CGGTATAAAG 


ATATTGGCAA 


. 5400 




X i *jAX X lwvi 


rp » /"»■ T -I - 1 L 7\ ' 1 ~ I -f* 
Lr\\— X X Inl l V* 


AACTTACCAT 


TCTTTTGTTT 


TGCTTTATGC 


GCTTCCTTAT 


5460 




1 LuLL XXX 


X X Inlwiuul 


fVATATGATT 


TATAGTCCAT 


TTTTTCACTA 


TCATTGTGAT 


5520 




/VT'PIVV'PIl'P 

GGTQTGvj 1 A X 


X\9V7v7 X OiL-L- X 




CACTTAATTC 


CGCCATATGA 


TTAGCCACTT 


5580 


10 


TAIlbdLbin 




cVwAWinu x xvj 


AATGCGTTCA 


TCGTGTATAA 


CACCCATGAC 


5640 




AC CATCAATA 


TGCCTTAGTT 


CTTGGTCATC 


T A f* r PTT AT*rC 


TCATCTAATA 


CTTTAATACG 


5700. 


15 


CACACGTGTC 


ATACAGTTCA 


TGACACTATC 


TATATTATCC 


ATACCACCTA 


CTGCAGCAAT 


5760 


AATTCGTTCT 


GCAAGTTGTT 


GTTCTTTGGT 


CATTTAAATC 


CCTCCTAAGG 


TTGTCTATCT 


5820 




CTGATTGCTC 


GTTTAAaATG 


TCACCATTGT 


TTAATAACCG 


TCTTGTTGCT 


TCTTCCTTAG 


5880 


20 


AAATGC CACA 


CATACCCATA ACTGTCGCAA 


CTTTCACATC 


ATGCTCAGAT 


ACCTGATATA 


5940 




ACGCCATTGC 


TTCATCATAT 


GTGATAGCAC 


ATATTTCTTG AATAATACGC 


ACTGAACGGT 


6000 




CGATCAGTTT 


TTGATTGGTT 


GCTTTAACAT 


CAATCATGAG 


GTTATCGTAA 


ACTTTTCCGA 


6060 


25 


CACCAACCAT 


TGTGATGGTT 


GAAATCATAT 


TTAAAATTAA 


CTTTTGTGCt 


GTACCAGACT 


6120 




TTAAACGTGT 


TGAACCAGTT 


AATACTTCTG 


GACCAACTTT 


AACTTCTACT 


GGATAcTGCG 


6180 




CAATTTCACT 


TATAACTGCA 


TGTTCATTGC 


ATGAAATAGA 


TACTGTTGTA 


GCACCGATTG 


6240 


30 


TGTTAGCAAA 


TGTTAAACCG 


CCTATAACAT 


ATGGCGTTTT 


GCCACTCGCG 


GCAATTCCTA 


6300 




TAACGACATC 


TTTTGATGTT 


AAATCTATAT 


TTTTCAAATC 


TTCTTCCGCT 


AATTTTTTGT 


6360 


35 


GATCTTCCGC 


ACCTTCTACA 


GCCATCGTCA 


TAGCATGTTG 


TCCACCAGCA 


ATAATACCTA 


6420 


TAATTTCATG 


AGGGTCAGTA 


TTGAATGTAG 


GTACACACTC 


CGCTGCATCT 


AAGACACCCA 


6480 




ACCTTCCACT 


TGTACCTGCA 


CCGATATAAA 


TCAATCGTCC 


ACCCTTTTTA 


TACTGTGCAA 


. 6540 


40 


TTGTTTTTTT AATTACTTTT GTCAATTGTG 


GTATTGCCTT 


TCGAACTGCT 


AACGGGACTT 


. 6600 




GCTGATCTTC TTTATTCATC GTAATTAAAG 


CCTCTTCCAC 


AGTCATTTCA 


TCAAGATGCA 


6660 




TCGTCGCTTC 


ATTACGCGCT 


TCGGTCGTAC 


TATTTTCCAT 


CACTTCTTAC 


ACTCCCTAGT 


6720 


45 


TTTTTGAAAA 


TCAAATGTAT 


CATTCGGCTC 


GATACAACTT 


AACAGTGGTA 




6780 




AATAATTTGT 


GCAaCAACAT 


TCACATTGTC 


ATGTGCACTA AGCGTTTGTC 


TCACAATTTG 


6840 




CATTTCGCCT 


TGATAACGTC 


CGTTATTCAA 


ATTATCAACG 


GTTACTGAAC 


CAATGCGTCG 


6900 


50 


TTGCGTCGTA 


AACTGTGGTT 


GAATCGAATG 


TGGACATATT 


TGTCTTGACG 


TTTCCGAACG 


6960 




AATGACATTT 


TCCGGATTAT 


CCGGGCGTAC 


TTTATGACAC 


ATATCGAAAA 


GGTAAGTCAC 


7020 
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AAGTTGTTTT GCCTGCCTCA TTTCAATCAA 
AGTTTCTTGT AATAATTTAG CTGCAACGAC 
5 TGGCAAGCCT TTATGCAAAG GACCTCGCAA 

TGCCTTTGGA TTAAATTGAT AAATGAGTTC 
TCCCGTATCT GGTCTTGGAT AATAGTTATG 

10 

TTGTTGATGT AAGCTTGTTA ACAATTCCCG 
TAAACCCTGT GCCATTATCG CTTCGATTGC 

15 CATAAATTGT GCATCATATT GTCGAAGATG 

ATTAGCATCT ATGAGGTAAG TCACTTGTTC 
ATAATGATAT TTTGTCTGGT CATCTTCTTC 

20 GTAACCTTGT TTAATCATTC GCTTAATATA 

TGAAAAGCCT GTCAAAGTAG CCCTCCTTAA 
TTGTGTAATC GCTTACATTT TACTATAAGA 

25 GCCTGTTCAT TGTAATAATC TTACATATTT 

GATTATCCTT TCTTTTAAGT GCTGATAATA 
TTATACATTT TATTCAGGAT TATCTTATAT 

30 

AGAGATTTGA AATTGAATTT AATAATTGTA 
AGGAGTCGCA AACAAATAAG ATTCAATAAG 

35 TCGTGTCTTT TTTTATTGAA TCTTAAATAA 

GGAAGAAACT TTTCGGTCAA TTGCAACGTA 
TTTTACCAGC AGCTGGTCTG TT ATT AG CT A 

40 " AACACTACTT GCCGTTTATA CAAAATGGTG 
GTGCTGGTGG TATCATTTTT GATAACTTGC 
GATTAGCTGG GGGTGATGGC GTAgcAGCTA 

45 ACAAAACAAT GGGCGACTTT TTACAAGTTA 

GTTACGCTAG C A TTTTAGGT ATCCCAACAT 
TCGGGGCCCT GGCAGCTTGG TGTTATAACA 

so 

TAGGTTTCTT CGCTGGTAAG CGTTTCGTAC 
TAGCATTCCC AATGGCATTA ATTTGGCCAA 

56 



TGAGTCTCCA ACTAACACTT CAGATACACC 7140 

AGGATGACTA TGTCTCGTTG CTTCAATTGT 7200 

ATCACTCCCT ACAATAAAAC CATATATTTG 7260 

ATTTTTCTTA TTG ACCAAGT CAACAGAT AA 7320 

ACAAAATGAA AGTAATGTAA AATCATTCAA 7380 

GGAAATAATA CTTGCATTCA AACAGCACTT 7440 

CTCAATTGAT GTACTATGAT CGATACXSAAT 7500 

GTCATAAAAA GATGGTCTTA AAATAGATGG 7560 

ATGTTTTAAT AAATTGAGTA GTTTTGTGAA 7620 

TGGTATTTGT ACAGATGTAA AAATCATTTG 7680 

CGCTTCATCT AAAGGTTGTC CTAAATACAC 7740 

CAATATAATT ATTAGGAAAA TATAGTTGAT 7800 

GAAAACACAT TACAATATTA ATCAGTTAAA 7860 

CTGTCACAAG TTAATTATTA CACCATCAAA 7920 

GCTGCTACTG CTGGATTATT ACAATAACTT 7980 

TATGTTTTAA TAATAATCTG TGAACAATTA 8040 

TTGAAAACGC ATACTTCACC ATGCTAAAAT 8100 

ATGTGATGGT T AC CAACACA GTCTATTTGC 8160 

TAAATACAAC TTTGG AGGTT GGACAAGTGA 8220 

TTGGTAAAGC GCTAATGTTA CCTGTTGCGA 8280 

TCGGTACAGC TATGCAAGGT GAATCATTAC 8340 

GCGTACAAAC TGTCGCTAAA TTAATGACAG 84 00 

CTATGATTTT CGCATTAGGT GTCGCAATCG 8460 

TCGCAGCATT CGTCGGTTAC ATAATCATGA 8520 

CACCTAAGAA TATTGGTGAT CCAGCGAGTG 8580 

TACAAACAGG TGTGTTCGGC GGTATTATAA 8640 

AGTTCTATAA CATTAACTTA CCATCTTATT 8700 

CTATTATGAT GGCTACAACA TCATTTATTT 8760 

CGATTCAATC AGGATTAAAT GCATTCAGTA 8820 
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TATTAATTCC ATTCGGTCTA CATCACATTT 
CATGGAAAAA TGCAGCTGGT GAAATTATTC 
5 TTCGTGAAGG CGCACATTTG ACAGCTGGTA 

TGTTCGGTTT ACCTGCAGCA GCTTTAGCAA 
AAGTAGTAGC AGGTTTAATG GGTTCTGCTG 

10 

AACCATTAGA ATTCTCATTC TTATTTGTAG 
TTGATGGTTT ATCATTCTTA ACATTGTACT 

t5 CAGGTGGTTT CATCGACTAC TTCTTACTCG 

TAGTCATTCC TGTAGGTCTT GTATACGCAG 
TTGTAAAATT AAAATACAAA ACACCAGGTC 

20 CTTCAGCAAC TGAATTACCA TATGCAGTAT 

AACATTTAGA CGCTTGTATC ACACGTCTAC 
ATGTTC CTGG TTTGAAAGAT TTAGGCGCAT 
AAGCAATTTT TGGTCCTAAA TCTGACCAAA 
GTCAAGTAGT AGAAAATCCT ACTACTATGG 
CAGAAGATAA ATCTGCAACA AGCGAATTGA 

30 

AAGTAACACC ATT AT CAGAA GTGCCTGATC 
GTATCGCTAT CAAACCTTCA CAAGGTGAAG 
TGATTTTCCC AACAAAACAT GCAATTGGTC 

35 

TCCACATCGG TTTAGACACT GTTAAATTAA 
AAGGTCAAGA AGTTAAACAA GGTGATTTAT 

40 ATCATGCAAA GAGTGATATT ACGCCTATTA 

ATTTTAAACA AGGTGAACAT GGCAACATTT 
AATGCTTACT ATAAACAGGT GCGTATACCT 

45 CTATTGTATT TTGCAGCATC ATTGATAGTT 

TCATCAATTA AAGCCCCCCT TCATACTCAT 
TTAGCGTTTT CACAACAAAG TCAACTTCCT 

SO 

TTAAGTGTAA ATATAGAGAA AAGGTGGCTT 
TAATTGACGC TATTCATCGA GCAGGCGTCG 
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TCCACGCACC 


V»X 1 l*Xvi\9l IV* 


unu x x x w x x 
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ATCfJAAPAAA 


* 900O 
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CACCATTATT . 


ATT.CTTTATT, 






TATTAGATCT 


TCATCT Aw i 


iAlntni X V«- X 




GTATACTACC 


TAATAAGACA 


CAATCiv? xvjVjt 1 




TTATTTACTA 


CTTCGTATTC 


CGATTCTTAA 


Q A O rt 


GTGAAGATAA 


ACAATCACAA 


GCGGCTAvTxa* 




TAGAAGCTAT 


GGGTGGCAAA 


G CAAACA 1 1 A 


954 0 


GTGTTGAAGT 


TAACGACAAA 


TCTAAAGTTG 


9600 


CTGGTGTATT 


AGAAGTCGGC 


AATAATATGC 


9660 


TCAAACATGA 


AATG CAACAG 


ATTATGAATG 


9720 


AAGACGATAA 


AGACGAAACT 


GTTGTTGTTG 


9780 


GCCATATCGT 


GCATGCACCA 


TTAACTGGTG 


AO * r\ 

9 84U 


AAGTGTTCAG 


CGAAAAAATG 


ATGGGTGACG 


9 9UU 


TTCGTGCACC ■ 


All CAACGGT 


. AAAGT ACAAA 


y y 0 u 


TTGTATCAGA 


TAGTGGTTTA 


LjAAL 1 A 1 XAA 


1 a n n 


m /^/-^ n 'Jk ")N ^*/*9 

ACGGAGAAGG 


CTTTACTTTA 


C A TYITTYS Af*l/"1 
V_~H.±VjX X\xfM-*J 


X u u 0 u 


TAATCAACTT 


TGATTTAGAC 




X. U 14 u 


T CG IXiAUAUA 


AwjAAAUil X 


APAAAPPTTf; 
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CATTTGGCGA 


XLnnl X4\X X X 




10260 


T CAT AAJliO 1 Vj 


i\V-\jl_GL»v_ X\j X 




x u j a vj 


CGCTCTCCCC 


TTAAATTTTG 


AATTTTAAGA 


10380 


TTCCTAAAAA 


ATATTAATTG 


TTCACTATTG 


10440 


TGACCTTACA 


CTATATTOGA 


GGCTATCATT 


10500 


TTTTTATGAA 


ACAACGCATT 


GGAGCTTACT 


10560 


ATAAAATTTT 


TGGTGTTCCT 


GGTGATTTTA 


10620 
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10 



1S 



20 



30 



35 



40 



ATGAATTAAA CGCAAGTTAC GCAGCGGACG GTTATGCCCG TCTTAATGGA CTCGCTGCAT 10740 

TAGTTACTAC ATTTGGTGTT GGCGAATTAA GTGCCGTCAA CGGTATCGCA GGTTCATATG 10800 

CTGAACGCAT ACCTGTCATT GCGATTACAG GTGCGCCGAC ACGTGCTGTT GAACAAGGCG 10860 

GTAAATATGT ACATCACTCA CTTGGTGAAG GTACATTTGA CGACTATCGA AAAATGTTTG 10920 

CACATATAAC CGTTGCACAA GGTTATATCA CACCTGAAAA TGCAACAACC GAAATACCAC 10980 

GTTTAATTAA TACAGCAATC GCCGAAAGAC GCCCAGTTCA TTTACATTTA CCAATCGATG 11040 

TCGCAATCTC TGAAATTGAG ATACCGACAC CATTTGAAGT GACGGCAACT AAATATACGG 11100 

ATGCATCAAC ATATATAGAG TTATTAGCAA CTAAACTGCA TCAAGCGAAG CAGCCTATCA 11160 

TCATTACTGG ACATGAAATT AACAGTTTTC ACCTCCATCA AGAATTAGAA GATTTTGTAA 11220 

ATCAAACACA GATACCAGTA GCACAACTTT CATTAGGAAA AGGTGCTTTT AATGAGGAAA 11280 

ATCCATATTA TATGGGTATT TACGATGGGA AAATTGCCGA AGATAAAATA CGAGATTATG 11340 

TGGACAACAG CGATTTAATT TTAAATATTG GAGCCAAATT AACAGATTCA GCAACAGCAG . 11400 

GTTTTTCATA CCAATTCAAT ATCGATGATG TCGTTATGTT AAATCATCAC AATATCAAAA 11460 

TTGACGATGT TACAAATGAT GAAATATCTC TACCATCATT GTTAAAACAG TTATCCAATA 11520 
TTTCATATAC GAATAACGCA ACGTTCCCTG CGTATCATCG TCCAACATCA CCCGATTATA . 11580 

CTGTTGGCAC AGAACCATTA ACACAACAAA CTTATTTTAA AATGATGCAA AATTTCTTAA 11640 

AACCAAATGA TGTCATCATT GCTGATCAAG GTACATCATT CTTTGGTGCT TATGATTTAG 11700 

CATTATACAA AAACAATACT TTTATAGGGC AACCGTTATG GGGTTCTATC GGCTATACAT 11760 

TACCTGCAAC ATTAGGTTCA CAATTAGCAG ACAAAGATCG TCGTAACTTA TTATTAATTG 11820 

GTGATGGCTC ATTGCAACTA ACTGTTCAAG CTATTTCAAC TATGATTAGA CAG CAT ATT A 11880 

AACCGGTATT ATTTGTGATT AATAATGACG GCTATACGGT AGAACGACTT ATTCACGGCA 11940 

TGTATGAACC TTATAATGAA ATTCACATGT GGGATTATAA AGCTTTACCA GCTGTATTTG 12000 

GTGGTAAAAA TGTTGAAATT CATGACGTTG AATCATCAAA AGATTTACAA GACACGTTTA 120 60 

ATGCAATTAA TGGTCATCCC GATGTGATGC ATTTTGTCGA AGTCAAAATG GCTGTCGAAG 12120 

aCGCACCGAA GAAACTCATC GATAt CGCTA AAGCTTTTTC ACAACAAAAT AAATAATTTC 12180 

ATCGTATACA GGGTATAAGT TTAAGCGAAT ACTTTATTAA ACGAATAGGA CTCTGATATA 12240 

AGATGATTAA TTTTAATAAA ACCGCTTTAG TGTTAATCGA CCTGCAAGAA GGTATTCTTA 12300 

AAATGGATTA TGCCCCATAT ACAGCTGAAA ATGTCGTTCA AAACGCTAAT AAATTAATAG 12360 

ATGTTTTTAG AAAAAACAAT GGCTTTATCG CTTTTGTTCG CGTGAATTTC TATGATGGTA 12420 
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AGTCGTTTCC 
TTTAGTGCAT 

CAATTAAACT 
GATCAATTTC 
TTTCTAAATA 
TTATTTCACA 
ATCTGTTAAA 
ATTTTCAAAA 
TATTATCTTA 
AGAAGAAACT 
TTGGTGCCGG 
TTATCGCTAA 
CTATTGGCAT 
ATGCTTACAT 
GACTGGCAAC 
CTTTATATTT 
AGCCATCAAG 
TAGCAATTAT 
TTAGTAAACA 
TAGATGCGCT 
GTATCGAAAA 
TTATGATGGG 
TCAAACTTAG 
ACTACGGTAT 
GTTTG ATT AC 
CGATTGCAAC 
TTATTATGTA 
TACTAACATT 



ATCATTTATT 
TTGTAGGAAC 
GTGGTGTCGC 
ACAATCAGTT 
CAATAGATAA 
TATTGAACTA 
AAGTATTAAT 
TCGTTCTTAA 
AATTTAGTAT 
ATTAAGTAGA 
AACATTTAAA 
CAATCTTATC 
CTTAGGATTT 
TTCAAAGACA 
TTTCACGATT 
GACATCATTT 
ATTTATTTTT 
AATTTTAGAA 
TTTATTATTT 
ATATCAATCA 
AGCGTCATTG 
TCCAACTGAT 
GAT CATTT AT 
TGAAAATGGT 
CGTCCTGTTG 
GGCATTTTCA 
AGTTGTAAGC 
CTCAGTCCCA 
ATTTAGTAGC 



AGACAAGAGA 
AGATTTGGAC 
AACGCATATT 
TTTTGTTACA 
TGTATTCCCA 
AACATATACT 
ACGTCGGGTT 
CTTACGCCCC 
TTATTGCAAA 
TTTTTATAAG 
GAAAACATGT 
TTCCCAATAC 
TTAATTACAG 
TCTGGTTTAT 
GCCTTATATC 
GAAATTGCAT 
AGCTTCGTCT 
TATATCGGTA 
GCTTTTATCC 
CATGCCTTAT 
GCATTTGGTA 
ATCGCTAAAG 
ACCCTACTAG 
GGTATTGCCT 
TCACTTATCG 
GAAACATTCG 
TTTATTTCGT 
GTGTTAATGT 
AAATTCCATC 



GATGACGATT 
TTACAATTGC 
GGCGTAGATA 
GATATGATGA 
TTGATGGGAC 
TCCCCCCTTC 
GTCTAACCTT 
TACTACATAA 
ATTATGTATC 
TTCTAAAAAG 
TTATAGGTTC 
ACTTGGGTCA 
CAATTGGCTT 
TTGAAATTGC 
TAGTTATCGG 
TTTCGCCATT 
TCTTTGTGAT 
AATTTTTAAA 
ATCCATTAGG 
TTAACGGCTT 
TTATCATTGT 
AAACAATTAA 
CAATCATGGG 
TAGCGCAAAT 
TTATGGTTGC 
AACACCTTTT 
TCTTATTCGC 
TCTTATATCC 
ATTCAAAACT 



TTGTCATAGA 
GACGTCGAGG 
CGACAGCGCG 
GTGCACAAAA 
AAACAATAAC 
GATCATGTTG 
CTATATTTAA 
AAAACAGTAT 
ACTTTATGTT 
GAGAACAAAT 
TATGTTATTT 
AGCTGCTGGT 
ACCATTTCTA 
ATCGCGTGTT 
ACCATTTTTC 
TTT AT CAC CA 
TGCATGGTTT 
TCCGGTATTC 
TGGCATATCT 
TTTAG ATGGA 
TGCAACGATT 
GTCTGGTACT 
TACATTAAGT 
TACTCAATAC 
TTGTTTAAAA 
CCCTAAAATG 
GAATGTTGGT 
ATTAGCAATT 
TATTTATCAA 



CAAACGACAT 
AATTGATACG 
AGATGCCTAT 
CGAAACGCTA 
TACAAACGAC 
AGGGGGATCT 
CATATTCTAT 
TTATTCCGGA 
TAATTTTTGA 
ACATATATGA 
GGTTTATTCT 
TCTAACGTTT 
GGTATCATTG 
AATAAAACAT 
GCCTTACCTA 
AAGCAAATCA 
TTTGCG AG AA 
. TT AGTATT AT 
GATGCACCTA 
TACAATACCT 
AAAAAGTTAG 
AT CAGTATCA 
ATTGGTCATT 
TACTTAGGTA 
ACAGCCATCG 
AATTAGCTAG 
TTAACTAAGA 
GCCTTGATTG 
TGTAC CATTT 



12540 
12600 
12660 
12720 

: 12780 
,12840 
12900 
12960 
13020 
13080 
13140 
13200 
13260 
13320 
13380 
13440 
13 500 
13560 
13620 
13680 
13740 
13800 

, 13860 
13920 
13980 
14040 
14100 
14160 
14220 
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50 



GCACATCATT CTCACAAACT TTGATTAATT TCAGCCAAAA ATATTTACCA TTATCAGACA 14340 

TTGGTATGGG CTGGGTTGTT CTCAGTTTGA TTGGTTTCAT TATCGGCTTC ATTATTTATA 14400 

AAATTAAGCA TCGTAAAATT CCACAAGCAT AATACTATGC CACAGTCATA TGTTAAACAT 14460 

ATGCTTGTGG CATTTTTTAT TCATACTACA TTAAACTGCA ATCGTATACA TACATATCAA 14520 

TGATTATCCA CAAAAAATAT TAGTACTTTC ATTTTAGAAA TCACATTAAT ACAAACACAA 14580 

CCTTATCTTT ATATTATTAA ATTTATATTT GACACTTATA TTGAACAACT GTAATATATT 14640 

AATATTAATT CTTTAAAATG TATAAATATA AAGGAGGGAG ACCGATGaAT TCAATCATTG 14700 

aATTAACTGA TTATTATAGC TCTAATAATT ATGCACCACT TAAGCTTGTC ATTTCTAAAG 14760 

GTAAAGGTGT CAAAGTTTGG GATACTGATC GCAAACAATA TATAGATTGC ATTTCGGGTT 14820 

TTTCAGTTGC AAACCAAGGC CATTGTCATC CAACAATTGT TAAAGCGATG ACAGAACAAG 14880 

CTTCAAAGTT GTCTATCATT TCACGTGTCC TTTATAGTGA CAATCTCGGG AAATGGGAAG 14940 

AAAAAATTTG TCATCTTGCT AAGAAAGACA AAGTACTCCC CCTTAACTCT GGTACTGAAG 15000 

CTGTTGAAGC AGCCATTAAA ATTGCTAGAA AATGGGGCTC TGAAGTTAAA GGCATTACTG 15060 

ACGGACAAGT TG AAAT CATC GCTATGAATA ACAATTTTCA CGGTCGTACA CTTGGCTCAT 15120 

TATCACTATC TAACCACGAC GCATATAAAG CAGGATTTCA CCCCCTACTT CAAGGCACTA 15180 

CAACAGTAGA TTTTGGAGAC ATTGAACAAT TAACACAAGC TATTTCACCG AATACAGCAG 15240 

CAATTATTTT GGAACCAATT CAAGGTGAAG GTGGCGTTAA TATACCACCG AAAGGATATA 15300 

TTCAAGCTGT GCGTCAACTA TGTGATAAAC ATCAAATATT ATTGATTGCA GATGAAATTC 15360 

AAGTTGGTCT TGGTAGAACT GGGAAATGGT TTGCTATGGa ATGGGAGCAA GTCGTTCCAG 15420 

ACATTTATAT TTTAGGTAAG GCATTGGGTG GCGGCTTATA CCCTGTATCT GCTGTACTTG 15480 

CAAATAATGA TGTCATGCGT GTTCTAACAC CAGGTACACA TGGTTCAACA TTTGGTGGTA 1554 0 

ACCCTTTAGC CATTGCAATA TCGACGGCAG CGCTTGATGT ACTTAAAGAT GAACAACTGG 15600 

TTGAACGATC AGAACGCTTA GGTTCATTTT TATTAAAAGC GTTGCTACAA CTT AAA CATC 15660 

GTAGTATTAA AGAAATTAGA GGTCGTGGTT TATTTATAGG GATAGAGCTT AACACAGATG 15720 

CTGCACCTTT TGTGGATCAA CTGATTCAAC GTGGAATCTT ATGCAAAGAC ACGCATCGTA 15780 

CTATCATTCG ATTGTCTCCA CCTCTAGTCA TTGATAAAGA GGAAATCCAT CAAATTGTTG 15840 

CAGCTTTTCA AGACGTTTTT AAAAATTAAC AATTAATCAT TTATATATGA CATAGGAGGG 15900 

ATT CATGATG ATTAAAGTAG GTATCGTTGG CGGTAgcGGT TATGGCGCAA TTGAATTAAT 15960 

TCGATTGTTA CAAACACATC CTCATGTAAC GATTGCACAC ATCTACTCAC ATTCAAAAGT 16020 
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ACTTACAGTG 
TAAAACATGT 
ATTTAGAATT 
AGATGATTTG 
AACGAAGCTC 
ACTTATTAGC 
GTCAGGTGCT 
AGCGCTTATG 
ATTGCGGGTC 
ATTTTATCAA 
TTAATGACCT 
CCAACCACAA 
ACAACGCAAA 
CAAGCCATTC 
TCACCAGTTT 
ATAACTTTTC 
GTATGCACAT 
TGGCAAGTGC 
CTGAAGACAC 
ATGCAAATTC 
TTGCTCAACA 
GTGAATATTT 
TTGCAACGCC 
TCGCTGTATC 
CAGGTATGAT 
TTGAATCGAA 
TTACTGTTGA 
TTGAACACCA 
ATTTTGTCTG 



GaTAATAATG 
ATCCCTCCCT 
AAGAATCGTG 
AATCATGCTA 
ATTTCTAATC 
GAAAAAATAG 
GGTCGTTCAT 
CAATCGGAAA 
AAGATGTATC 
CAATATATGT 
CTTATTATGC 
AAGAAGTACT 
CAGCAATTTT 
AAAATTTAAA 
ATC CAT AAGG 
AATT ATTAAA 
CGGTTTACGC 
AGCTGCCGTA 
TTTACAAAAG 
TTGTACCGGT 
ACTTCAAATA 
GCCTATGGAT 
AGGTGCGTTT 
ACTAAAAATC 
TCACCCAAAT 
TACACTTCAT 
TGGCGATACA 
AATACTTAGT 
TACATTTTTA 



ACTGTGATGT 
TAGTAGAAAA 
AAATATATGA 
TTTACAGCAT 
CTGGCTGTTT 
TAGATTTGTC 
TATCACAACG 
CCATAAACAC 
AGTCATATTT 
CAAATTATCA 
TAATCAGCCA 
CGGTAGTAAC 
AGTATCAGTG 
TATATTATAT 
GGTGTTAGAA 
CATGGCGATA 
GCTAACAAAA 
TATACTTTAA 
TCTAAAGGAA 
CAACAAGGCA 
CCATCTGAGC 
AAAATTAAGA 
AACGAGGCAA 
GATGGTAAAA 
ATGGCTACCA 
CAATTATTAA 
AGTACAAATG 
CAAGACCATC 
GCTAAAGCTA 



AATTTTCTTT 

AGGTATTCAT 

AGGATATTAC 

TTCAGAATGG 

CCCTACAGCA 

ATCTATTATT 

gTTcATTTTT 

AAACCGGAAA 

ACACCACATC 

TCTGAATATA 

TTTGTCAGAA 

TACTGCGATA 

ATTGATAACC 

GATTTTGAAG ' 

TGAAACATCA 

TCAGTACACC 

AAGACTTTGG 

ATCAGTTTAA 

AATTACAAGC 

TAGATGATGC 

ATGTTGCTGT 

CTGGGACCGA 

TTTT AACAAC 

CCGTTACAAT 

TGCTTGCTTT 

AATCTTCGAC 

ACATGGTATT 

CACAATGGGA 

TAGCCAGAGA 



GCGACACCAG 

GTTATCGATT 

AAAGAAACTG 

CAATCGTTTG 

ACATTATTAG 

ATTGATGCTA 

CAGAAATGAA 

TCGAGCAATA 

TCGTACCAAT 

CGACTGAATC 

TTAG AGAT AT 

TCGGCATCTA 

TTGTCAAAGG 

TGACGACTGG 

AG AAACGACA 

TCAAGGCTTC 

GTGGATTTAC 

AGCTGCACCA 

ACTTGTTGTT 

ACGACAAACA 

TGCTTCAACT 

ACATATTAAG 

TGATACCTGT 

TGGTGGTAGC 

TATAACAACC 

TGACCATACA 

AGTCATGGCA 

AACATTTGTT 

TGGCGAAGGC 



CACCCGTAAG 
TATCTGGCGC 
CTGCAGCACA 
ATAACAATGG 
CATTACATCC 
AGACCGGCGT 
TGAAAATCTA 
TTTATCTATC 
GACACGAGGT 
ATTACATAAA 
TGGGACTTTT 
TGTAGATGAA 
CGCAAGTGGG 
CCTAAATCAA 
. TCACAACAAT 
ACX3GCTGGTG 
TCATCGTCTT 
.CTTATTGTCA 
AATTCAGCTA 
CAAACATGGG 
GGGGTCATTG 
GATGCTAATT 
ACAAAACATA 
ACCAAAGGTT 
GATGCATCGA 
TTTAATATGA 
AATCACCAAG 
GATGCATTCA 
GCAAGAAAGT 



16140 
16200 
16260 
16320 
16380 
16440 ; 
16500 
16560 
16620 
16680 
16740 
16800 
16860 
16920 
. .16980 
17040 
17100 
17160 
17220 
17280 
17340 
17400 
17460 
17520 
17580 
17640 
17700 
17760 
17820 
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CTATCGTAAG TTCAAATCTA GTAAAATCAG 
GAATCATTAC AGCTATTGGC TACAGCGGAT 
5 AACTGAACCA AATACCTGTC GTTGATAAAG 

TGTCGAATAC ATTAACTCAT GAAAATGTCA 
CTGCAGCGAC TGCATACGGT TGTGATTTAT 

10 

ATCGAACATA AGGTGGTGTT GGTTAGATGA 
CACTTAGTGA CATGCATCCA TCAATTATTA 
TCTACCCCAT TATCGTTCAT GGCGGTGGCC 

15 

AAATCGAGCC ACACTTTGTT AATGGCCTAA 
CTAAACACAC GCTCATTGCA GACGTTAACA 

20 AATGTTCTGC AATAGGCTTA TGTGGTTTGG 

ATCAACAATA TGGATATGTC GGTGTTCCGA 
TATGTACTAA ATTTGTACCT ATCATCAATT 

25 TTTACAATAT TAATGCTGAC ACGCTTGCCT 

TTTATGTATT AAGTAATATT GCAGGTGTAC 
CATTAGTCGA TATTCATCAA TATATTGAAC 

30 AAGTGCTAGA TGCCAAAAAT GCGATTGAAA 

GAAACAAGCC AAATATCATT GAATCTATTT 
TTAATTCATA ACTATGAAAT TAAGGCCTAA 

35 

CGATTATCCA TTGCGCTAAA ACATTTATTT 
AGT^CGATAC AATATGAGAT GTAAAAAACT 
TATTTTAAGT TTTGCAAAGC TTTTTATTGT 

40 

TAGTAAATAG AGAGGAGTCC TTAAGTTGAC 
TGGAATTATC GGTGGCTTGT TATCTGGAAT 

45 ACCTCGCACA CCAGAACGTA ATGCAACGAA 

ATTTAGTAGT GAGTTTACGC ATCAAACATA 
AAGCTTTATT GTCCACTTTA GTTTTTCTAT 

50 TAAAAAATAC GCTTACTTAG CAATGGGACA 

ATTATTCCAC CTTATCATTA TGCCAATCAT 

55 



CTATTTTTGG CGAAGATGCC AATTTTGGTC 17940 

GTGAAATTGA TCCTAACTGC ACATATGTTC 18000 

GTATGGCTGT ACTATTTGAT GAGCAAGCTA 18060 

CAATTGACGT TCAGCTTGGT TTAGGTAACG 18120 

CCTATGATTA TGTGCGTATC AACGCATCAT 18180 

AATTTATTGT CATTAAAATT GGTGGCAGTA 18240 

ACAACATTAA GCATTTACGA TCAAACAACA 18300 

CATTTATTAA TGAAGCATTA TCAAACCAGC 18360 

GAGTGACTGA TAAAGCAACC ATGACCATTA 18420 

CTGCATTAGT AGCTCAATTT AAGCAGCACC 18480 

ATGCACAGCT GTTTGAAATT ACATCTTTTG 18540 

CCGCTTTAAA TAAGGATGCT TTACAGTATT 18600 

CGATTGGTTT CAATAACCAT GATGGAGAAT 18660 

ATTTTATTGC ATCATCATTA AAAGCGCCTA 187210 

TCATCAATGA TGTTGTTATA CCTCAATTGC 18780 

ATGGTGATAT TTATGGAGGT ATGATTCCCA 1884 0 

ATGGCTGTCC TAAAGTTATC ATTGCATCAG 18900 

ACAATAATGA TTTTGTTGGC ACAACAATCC 18960 

CAAGTTTTGA CACGCGAGAT GATTCCAGTT 19020 

AC CGTTCATC TCGTTAACAA TTTTGAATAC 19080 

AATAACCTTT TACAAATTTG TTTATCAAAA 1914 0 

GATTATTTTC ACAAAATACT ATAATGAGGA 19200 

GAAACGACAA ATGGGTATAT TCATTTATGC 19260 

TGTAAAATTA GGTTGGGAGG TCATGTTTCC 19320 

CCCACCTCAA GAGTTATTGC AACAATTAGG 19380 

TACATTTTCA AATATGGAAT TGCCTTGGGT 19440 

CGTCATTGCA ATTATTTACT GCATATTAGT 19500 

AGGTGCTGTT TTTGGTATTG CTATTTGGGT 19560 

GCATACTGTA CCTGCTGTGT GGGATCAACC 19620 
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AGTGCGACAA 


CATTTTGTCT ATCGCTATAA 


ATTAAATTAA 


TACACTGACT 




1 Q T/l r\ 
1" ■ 




TGAGTTTtAA 


ATCATCGTTT GAGTATGATG 


ATTGATGCTC 


ACGTTATTTT 




198GQ * 


5 


ATGATATGAT 


TCCAGCCAAC TTACGTGAGC 


ATTAAAGTCT 


CAAATGCGTC 








ATTATTTTCG 


GTAATTTCAA TATTGCTCAG 


TATATTTTTA 


C CTTATCACT 


TAC1 i 1AA1U 






TCGTCATGAT 


TTTGAATGAT GCCATCGTGT 


ATT CACCTTT 


CATTTTTCCA 


ATAAAAAAAU 




10 


ATCTAACAGT AAACATTTAG GCAGTATAGT 


TTAAAATCAC 


TGCGCAATGA 


TACTGTCAGA 


2 0 04 0 




CGTCATATTA ACTACTCAAT AACTGAAATA 


CAGACACTTT 


TTTATAACCC 


CAGGGTGCCT 


20100 


1S 


GTCCTAAGAA ACATAC CTGT ACCATAAACT GATCAAAAAT 


AAATTGTTTG 


AACTTCACTT 


20160 


CACGTGATTG 


ATAAAAGTGT GATTGTGTCA 


TATCATAAAT 


GTCCAATCCT 


TTGATTAAAC 


20220 




CTTCACCAAT 


CAATTTTGTA AAACTTTCTT TTTGTGTCCA TATTTGATAA 


AAATCATTTA 


20280 


20 


AACTACATAT 


TTGATGTGCT TCGTTTGTAG 


AGAAACACGT 


CACTAACGTA 


CGCCAGTCTA ; 


20340 




AACGTTGTGA TATdTTTTCG ATATCAATAC CAACTGGTTC 


TTTATCGACA 


ACACACACGA 


20400 




TATAAGGATA 


ACTATATGAT AAGCTCACAT 


AGATGGGCTG 


TCCATCACGA 


TTGTGTTGAA 


20460 


25 


CAATATCTGC 


CTTACCTCGT GGCGAAATGT 


GATAATGCCA 


TTCATGTGGT 


AATAAACCTG 


20520 




TGTCATGTTG 


AATTCCATAT TGCACTAAAA 


TATCTCCCAA 


TCTGTGCATG 


AGTTTATCTT . 


. 20580 




GATTGTATCT 


ATAGTTGACT GTACGCGGTT 


TTTTATATGA 


CCAACGACTT TGTGATATTA 


20640 


30 


ATTCTTCAAT 


ACTTTTCAAG TTACTCTGTA 


ATTGCATTAC 


AAATACTGTC 


ATAACTTTCC 


20700 




CTACTTACTT 


ATTGAATATT GTTTTGATAT ATTGTGCCCA . ATGATACAGC 


CAATTGTTAG 


20760 




TTATCGTTGG 


CCATTTTTCA CTGATGTGAT 


TCATTATTTT 


TAATGTTAAT; 


GTTGTATCTA 


20820 


35 


TCATTGCTAG 


TTGTTGTTCA CGGTCAACAC 


TAGTTAATCC 


AATCGTTTCG 


TACATGTCTT 


2038O 




GTTTCTGTAA AATTTCATTA aatgattcat 


CGCTGACGAG 


TTCAATTTCT 


TTGCGCTTAA 


-20940 


40 


CGCATTCTAA 


CAAAGATTTC ACCGGCATTT 


TATTAGGTGA 


TAGCACATGG 


TAAATGATTT 


21000 


GTGGTGTGTT 


GACCTGTGCT AATGCGACAA 


TTTGTCTTGC 


AGTCGTATCC 


ACAAAAGAAA 






AATCTACAGG 


CATTTCAGCC ATGCTAACCC 


. CGATACAATC 


CAGTTGTAAC 


AAATCATTCA 




45 


TTACCATTGA 


AAAACGGTTA GTCTTTATAT 


TTCTCATATG 


CCATCTTCCA 


TTGTAAGGAT 


21180 




TCGTGAAATT 


ACCAACACGT ACAATCCGAC 


CATCTAAGCC 


ATTATTTACA 


GCTTCTAATA 


21240 




CTTTTAATTC 


ACTATAAAAT TTGCTCCGTG 


TATATGGTGA 


TGTTAGTAGT 


TGCCCTITAT 


21300 


50 


AGACATCCGC 


TTsTGAAAAT GTCACATCTT 


CTGTGTCTAT 


ATCAAAATAA 


GTTCCCACAC 


21360 




TT AT CGT AG A 


CACATATATT AACCTTGCAT 


GATGTTGTTG 


TGCCAAACGT 


ATGACATCAA 


21420 
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CACCTCCATG 


; AATAATCGTA 


, TCCATGTTTT 


CTGGTAAAAC 


AACATCATCC 


ATACACTCGA 


21540 




AATCACCAAC 


AATGACTTCA 


ATGTTTGATA ACATTATTTC AACCGTCTCT 


TCTGAAAAAT 


21600 


5 


AATCATTTAA 


ATTCGTCATC 




ATGCTATTTC 


CTCATTATCA 


GCACGTATGA 


21660 




AACAATAAAT 


GCGATGACTG 


iAlvw 1 IVj 1 A 


T* 7A ^wTwrt^ ta TV rp 

OiAUi, iCAAT 


/-» TA /"^ TV T>7V TV /"•/"» TV 

GAGATAAv^CA 


CCTAAAAAAC 


21720 


10 


CTGTCGCGCC 


AGTCAATAGT 


GTATTTGCTA 


GAGGTCGATG 


ACTTAGACTA 


TCCTCTAAAA 


21780 


TACCCAAGTT 


ATAACGAGAC 


ATAACAATCT 


TTTGTAATTC 


GGAAAGATTA 


TCCGGTAATG 


21840 




CAACTAATGA 


TTGTTGATTT 


TGGTACATAT 


AATTAACAAT 


CTGTCGCACG 


GTTTTATATT 


21900 


15 


GGTATAATGT 


CTGCATTGAA 


ATATGATGGC 


CAAATGGTTT 


TAAATGCGAG 


ACAACTAACA 


21960 




TCGCCTCTAA 


TGAGTTACCA 


CCAAGTTCAA 


AGAAATCATC 


GTCAACACCG 


ACATCATTTT 


22020 




GTTTCAATAC 


CTCTCCAAAT 


ACATCAACAA 


ATGTCTGCTC 


AATTTCATTA 


GAGGGTTCGC 


22080 


20 


TATACACTTT 


ATTAGACTGT 


TGTATAGGTG 


ATGGATTTGG 


CAAACGCGTA 


GTATCCACCT 


22140 




TGTCATTCGT 


GGTTAATGGC 


ATAGAATCGA 


TATGCGTTAT 


AGTCTTAGGA 


ATCATATACT 


22200 




TAGGCAGCTG 


ATCATTTAAA 


TATTGCTTCA 


AATCCTGTTC 


CACTTGTTGC 


TCTCCGACAT 


22260 


25 


AATAAGCATT 


CAATATATCA 


TGCGTATCAA 


AGTGACTTAC 


TGTTACAACA 


CAATCAGATA 


22320 




TACCACGAAT 


AGCTAATATT 


GCATTTTCAA 


TTTCATCAAG 


TTCAATACGG 


TACCCGTTAA 


22380 




CTTTCACTTG 


TTTATCTATT 


CTTGCTAAAA 


ATTCAATTTG 


ACCATCAGAT 


GTATAACGTG 


22440 


30 


CTAAATCACC 


ACTATGATAC 


AACTTTCCTT 


TACCAAATGG 


ATTATTTTGC 


CATTTATCAG 


22500 




CCATTAATTC 


TGGACGATTA 


ATATATCCTA 


TCGCTAAACT 


AT CACCTGCA 


ATACACAACT 


22560 


35 


CGCCTGGCAT 


ACCAATACCG 


/"^ TV iT^TV TV ^ TV TV TV 

CATAAGAAAC 


/-i TV TV" rv*^ TV /"^ TV Ti 

CATCTGACAT 


AATATACACT 


TGGATGTTAG 


22620 


. ATAAGGGTTT 


GCCAATTGGA 


Al LAj 1 1 (JA(j 


GTATCAAATC 


IV ^"•^TA /"*TV TV TV TV 

AC CACAATG A 


TGTGACCAAT 


22680 




ACGA$GTGAT 


GACTGTTGAC 




/~'TV r PTVf?/- , /"»7V TT< 


/"< 7V TV 7V rf»7\ /*v m 


CCACAATGCT 


22740 


40 


TCTCAATATA 


TTTAACAAAG 




TAGTTGCCCC 


/-» rT'TVT 1 A TV Tf"* 

ijt-l-lVjlAAl t_ 


AACTTTTCAA 


22800 




TATAAAAGTC 


TTCCATAACA 


CTACACATCT 


GTAACGGAAT 


CGACGCAACC 


GTCACACGAT 


22860 




GCTTATTAAT 


GAGTTGTTGT 


AACTGTTCTG 


GATTAACACG 


TTCCTCTCTA 


TCTGGAATCA 


22920 


45 


CAAGCGTATG 


ACGATTTAAC 


AAACAACAAT 


AAATCTCCAT 


AACTGATGCA 


TCAAAAACAA 


22980 




TATTTGCATG 


TTGGAAAAAT 


ACTTCATTGT 


CGCCTAATTG 


CAATTCAGTT 


GACCATGCAT 


23040 




GCACTAAATT 


CAACAAATTT 


CGTTGTCGTA 


TGGCAACCCC 


TTTAGGCATC 


CCGGTCGTAC 


23100 


SO 


CAGATGTGTA 


AATAGCATAC 


ATCTCATTAT 


CTAACATCGC 


TGTGTTTTCA 


AGTTGATTGC 


23160 




CATGTAAATC 


ATCATATTGT 


TCATTTTCCT 


TTGATTCAAC 


AAAGCCTTTA 


GCATTTTCCA 


23220 
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TAGCATCCTC 


CAAAATTGCA 


CCTTGTCGTT 


TATTCGGAAA 


ATCAATATCG 


7\ TTVrrTRTRT 

AIAVjVj lAlAi 






AAGATGCACC 


TACTTTAACT 


GTCGCCAACA 


TCGCCGCAAT 


CATTTCAAAA 


LlAUul lulu 


inn 


s 


TAAACAAGGC 


AACCCGTTGA 


CCATTGCCCA 


CACCATTTGA 


TAGGAGCATG 


IvjUjI-AA 1 vats 






CATCCACATA 


GTTGCGT AAT 


GTTTCATACG 


TCATTGTCAA 


ATCATTCATG 


ACTAvjCVjCAA 






CATGATTACC 


TTGTCGTGAG 


ACAACTTCAT 


TAAAGTAACT 


TATGATAGAT 


11 A 1 1 iu^-Uvj 




10 


GGACATTAAG 


CATTCGATCG 


TTAACATGCG 


TATTGACCCA 


ATTTAGAAGT 


TC CT CCGTU t. 






CGTTTGGTAT 


ATCACAAATT 


TGTAGTGTAT 


CTTGATGCTT 


CAAAATATAA 


TCAATCATAA 




15 


TCATACATTG 


ATTACCCATG 


TGACGAACTG 


TTTCTGAGTG ATATAAATCG 


GTATTATACT 


23760 


CGATATTGAT 


TGTATAGTCA 


TCGCGATCTT 


CTTCAATGAT 


GAAAGATAAA 


TCAAATTTCG 


23820 




COGTCACTGA 


TTTGGGTTGA 


ATGTGTGTTA 


ATTTACTATG 


CCCAAAATGA 


GGATGATTCG 


23880 


20 


TTTCATTGTT 


TTGT AGT ACT 


AACATGACAT 


CAAATAATGG 


ATTCCGTGAG 


GCATCATGTG 


23940 


ATTGATCTAA 


GTCATTTACT 


AAACATTCGA 


ATGGGTATTC 


TTGATGCTCG 


TATGCCTCCA 


24 000 




AACTCATTTC 


CTTAACCTCT 


TGTAAAAACT 


GTGTCCACAX 


i 1 iAl*JA<jv»l 


GACGGTTGCC 


24060 


25 


CTCTATATAC 


CAACGTATTA 


GCAAACATGC 


CTAGCATTTG 




TTATGCATAC 


24120 




GCGCACTCAT 


CACACTACCG 


ACAACAACAT 


CATCTTTTCG 


/\lj\^/\X/\X V» lit 


CTTAACAACG 


24180 




TCATGACCAC 


ACTCATAAAG 


AACATAAAAT 


UMulAAl 1 XV» 


ZL r TY»f"*T r T ,r P*TYT 

n X V?v^ X J. X X \— X 


ACAT ACTTTT 


24240 


30 


GAAGTAGCTG 


TCTCATTTGT 


TGATTCATTG 


TAAATGACAT 


CATTGCTCCA 


TTTGTCGTTT 


24300 




TAATATTTGG 


TCTAACATAG 


TCTGTCGGTA 


AGCTTAAAAT 


AGGTACTTCA 


TCTTTGAATT 


24360 




GAGATAACCA 


ATATTGTCTA 


TGTTTCGTCA 


TATCACGATG 


CGACATCCAC 


TCACTATAGT 


24420 


35 


CTTTATATTG 


CAATTTAAGT 


GGTAACAATA 


ATTTATGTTG 


ATAAAGTGCG 


TTAAGATCAT 


244 80 




TCATTAATTG 


TATATTACTC 


ATACCGTCAT 


TAATGATATG 


ATGCGTATCT 




*5 A C A A 




ATGCATGTAA 


GGGACTTCTA 


ATGTATCTCA 


CTCTAATTTG 


ACTTGGCTTT 


1AA 


bUU 


40 


AAGGTGCTAC 


AAATTGGCGC 


ATGATTTCTT 


GTTCATCCGT 


AAAATGCGTG 


TTAACTTCTT 


Z*k OOU 




CAAAGTCAAC 


TGCAACATCT 


GCCACAATAC 


GTTGTCGAAC 


CTCATCATCT 


ACAACAATAT 


^4 / ^ U 


45 


ATTGTGTTCG 


TAAAATCTCA 


TGTCGCGCTA 


TCAAACGCTG 


CACTGCTTGT 


CGCAATTGAG 


24780 


CTACATTAAG 


TTCTGATGAT 


AACCGCCATA 


AAAAAGGTAC 


GTTATACACC 


GTATCTTTAT 


24840 




GGTTTGATTT 


CCATAATAAA 


TACATACGCT 


TTTGTGCAGA 


GCTCAGCACA 


TAATCATCTT 


24900 


50 


TAACTATAGT 


TTCTGGAATC 


ACTTCATAGT 


TTTGTTCTTG 


AACCTTAGCA 


ATCGCTTGTG 


24960 




CTAGTTCAAA 


TACAGTTGGC 


TTTTGTAATA 


AATCACCAAT 


TTGTAATCGT 


TTCCCAGTAG 


25020 
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10 



15 



20 



35 



40 



50 



AATTATCATG 
AGTGTTCGGT 
GCAATGCCTT 
AATTAACTGG 
GTGATAATGT 
GAACAATAAC 
ACAACTCAAT 
TGTTGCCATC 
TTGAATCTTT 
ACCCAAAGCC 
GCATGAT AT A 
TGTTAGGTAT 
TAATTTGAGG 
CTCCACCAAT 
GATTAAATAA 
CTACCGCTAT 
GCAATGGACC 
TCGTCGTCTC 
GGTGCGGAAT 
CATGATCTTC 
TCAASTCAAT 
CAACTTTAGG 
CAATTGGCAC 
TACTTTTTTC 
AACGGTGTGC 
CAAATTGCAC 
CTGTTTGCGC 
CACGTTCTGT 
TAATTTGCAA 



AATACCTACT 
ATCTGTACTC 
CTTATCTAAT 
TATCATGTAC 
ATGCATCGCT 
AACTGCTTTA 
CCTAAACCCT 
GGGTAACAAA 
GATAAATTTA 
ACTTGTACAT 
AACATGAGTA 
ATTATACGTC 
ATGCTTCGGT 
TAATAAATAC 
TCAGGAGGTT 
TGGATTTAAT 
ATATATTTCA 
TTCATTTAAT 
TAGTGTCCCT 
TAACGTGTTA 
GTGATTAATA 
CGTTACATCT 
GTAAGCCCCA 
AGCTATGACA 
TAAATCATTC 
AGCGACATGA 
ATCATCTATC 
CATCAAATTA 
ATAAATATTT 



TGATTCACAT 
GGTGCTACAT 
TTCCCATTAA 
TCCGGTAAGG 
TCATAATAAG 
TTAATACCTT 
CGAATCTTAA 
CGAACGATAT 
TCTGCTGTCA 
AATTCTCCAG 
CCCAGAATCG 
GTTGTAAATG 
TTTTGATTAA 
TTTAACGGTA 
AACCACATAG 
AATTGTTCTT 
AATGTTGCAG 
GGTACATAAT 
TTAGGGTTAC 
CATTTAGAAA 
TTTTGTTTAC 
TTTAAAATGT 
CCAGCTTTCA 
GCGACACGAT 
GCGCGTGCAT 
TTCGGCGTTG 
TCAGGCAAAC 
AGTTCATCtA, 
CGAACTAAGT 



GTAAAATATC 
AGGCATCCGT 
TAGTAATAGG 
TCATACGTAA 
CAACGATATA 
GTATACGCTC 
CTTGTTTGTC 
CACCACTTCT 
ATTCTGGCTG 
GAATACCAAC 
GTTTACCAAT 
TTGTATTTTC 
GCAAATCCAC 
CCAATACTTC 
TATTAACGTC 
TTTTAGCAAC 
CATCAAAGGC 
GATTTTGATG 
CAGTTGTCCC 
GATTATCAAT 
CATTTTCATA 
ACTCCTGACG 
ACACACCTAT 
CATTAGGTTC 
TCAATGTTTG 
GTTCAACTTG 
TTAAATTGAT 
CAGTTGTTCG 
CACTCAGCGT 



TGCAAAAATT 
ATCGACATAG 
AATTTGCTCA 
TTGTGATTTA 
CTGATCTTGA 
GAGCGCATGC 
CTTTCGATAT 
ATACATCAGC 
ATTTAAATAA 
GCCACACCGA 
AGGAATACGA 
AGTTGGTCCA 
CCACTTAGCA 
TATTCGTTCA 
ATTTTCATTG 
AATCAGCTTT 
TATAGTTCCT 
GACCAAGCGA 
CGACGTGTAA 
ATTTTTCCAC 
TAAAGCTTGG 
ATCACTTGGA 
CATCGCTATT 
AACACCATAC 
ATATGTTATA 
TTGCTCAAAT 
ATCGTCATAT 
TTTATTTCCA 
CTCGATTGAG 



TGGCATAGCA 
TCCATGATAG 
ATATGCATGA 
ATCTTATTAT 
TCATGATTTT 
TCAACCTCTG 
AAATAATCTA 
TGaTTTATAT 
CCTGCAGCTA 
CGCTCGCCTT 
TTTGGAACTT 
TAACCATTAA 
TTCAATACTT 
CTAGCAATCT 
ATTAATTGTT 
CCACCATTGA 
GATAACAAAA 
ACAATACCTC 
ATAACATAAG 
GCTATCTTAT 
TACGTTATTA 
TAGTTCGGAT 
ATCATCTCAA 
TGGTTTCTCA 
AACACTCCGT 
AAGGTAACAA 
AATTGAATAT 
TTTTCTTCAG 
AGGAAATCAt 



25X40 
25200 
25260 
25320 
25380 
25440 
25500 
25560 
25620 
25680 
25740 
25800 
25860 
25920 
25980 
26040 
26100 
26160 
26220 
26280 
26340 
26400 
26460 
26520 
26580 
26640 
26700 
26760 
26820 
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10 



1S 



20 



2S 



30 



35 



40 



45 



50 



CTAAAGATGT 
ACATCATATG 
GTAATTGCGA 
CATCTTTTGC 
AATGTGATGG 
CTAAATACAC 
ACGTTTGATA 
TGTCAGAGTT 
GATTGTCTTT 
TATTGCCACG 
AAATGGaCAC 
CTTTGAATAA 
CT AAAT CAT A 
CATGAAGTAT 
CATGTTGTgC 
GAGTTTAACC 
AAAATATTCC 
ATAATACTCA 
ACTCGTTATG 
CCTAAAATAC 
ATCTTCGATA 
CAAACTCAAT 
CGCATAAAAC 
TAATTACGAC 
TAAATTCAAT 
GCACCAATTG 
CGCAACACAA 
GCACTATATG 
GGCGAATAAA 



ATGTGCATCA* 
ATGATAACAA 
CATATTTTGC 
ATCGATTGTT 
TACATGTATA 
ACTAAGAGCG 
TAAAGCTTGT 
ATTCTCTAAC 
ATCATCATTT 
ATATGCATTG 
ATGAAAATCT 
AGGTGAATCA 
GTTTGCGGAA 
CATTGTTAAA 
ACAATTGTCG 
CAATACGCAT 
TGTTGAAATC 
TTACTTACTG 
TAATGaTTAA 
ATCTTGTATC 
AATAGCACAC 
ATTGTTGTTA 
AATTGTTATC 
CAAATTAATA 
TTGTATTCAC 
TTAAAACGAT 
TCCCTAACCT 
TTCCTCTTTT 
TAATTTCACC 



TGTATTTGAT 
TGAAAAATAG 
AACACACATT 
AACGTTAACG 
CCTAATGTGA 
AACGATGCCA 
TCAAATGGAT 
CGAAAATAGT 
CTATTTATAT 
CATAAATCAT 
aATAGTATAT 
TTAAAATGGT 
GAAGATGGAA 
TTGTCATCGG 
AT AATG CAT A 
TACGGTGTGT 
TCAAATTACC 
AAATTGCATG 
TATaAAACAC 
ATCGTTACAA 
TACAAATCGT 
CAAAATATCC 
CTTAAATTTT 
GGTTTTCCAT 
TTGTTTTTGT 
AAACATATAC 
AGCTAGTGTT 
AGCTTTAGGA 
TACAGTCGCA 



GTACATCCTC 
TCTCTAGTGA 
TATTAAAATC 
GCACAATATT 
CATCATGTTG 
TATCTATTGA 
GCTTAATTGG 
TTGAGTCTAA 
GTGCATGCTG 
CAAGAAnAAT 
ATGcAGCATC 
AAGTACTTAA 
CTTGTTTTAT 
TAGTAACATC 
CATCATTTTA 
CGTTGATTCT 
CATAATCATA 
ATGATATGAT 
CATTCGCAAC 
TTGGTATATT 
TAATCACTTT 
ATGAAGCAAG 
AACAAATTCT 
ATAAAAAGAT 
CCCCCAAATA 
AGTCCCATTT 
TCTGAAAAAT 
ATAATTTTAA 
ATT AT CAT AA 



AATAACATCA 
AAGCGAAGAC 
TGTTGTAAAA 
TCCGTGTAAA 
TTGACTCATT 
TGTCATATCA 
AAAATAACTA 
TGCTATATGC 
TCGAGTATTG 
ATCAATTTGA 
AGCGAACTGm 
TTCTTGCTTA 
CTCAATAAAA 
AAAAAAATGT 
GTAGCTTCAA 
GTATTATTTT 
AAAAGTCCTT 
AACCGACGAA 
ATATGAGCGA 
TTTCAATGTA 
CTGTTGTTCA 
TTTATATTAA" 
TAATAAATTT 
GCATAAAATA 
CACCAGCAAC 
GTAATGACGT 
GAATACCTAA 
AGCGTTGTTC 
AAACAACTAA 



TTACAACAAG 
TTCGCGCACT 
CGTTGACATA 
TCATTTGGTA 
ATATGATTAG 
TCAATCAAAT 
TCAATATGGA 
GATGCATCTT 
TTAATAACAG 
CTATCATCga 
AACAATTTAA 
AAAAAAGCTT 
GGCAGAAATT 
CTTATAGATG 
CATTTTTAGC 
TGTATATACG 
CTTTC AT AT C 
ATGTTAATTA 
TATATTCTAC 
AATTACATAC 
CATCTCATTG 
ACAAACAACT 
ATCTCTATTT 
AATATTTAAA 
AAGCATGCTA 
TAAGAAAACA 
TGCATTAACT 
TGAAACTATA 
TAAGCCAAAC 



26940 

27000 

27060 

27120 

27180 

27240 

27300 

27360 

27420 

27480 

27540 

27600 

27660 

27720 

27780 

27840 

27900 

27960 

2B020 

28080 

28140 

28200 

28260 

28320 

28380 

28440 

28500 

28560 

28620 
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is 



20 



30 



35 



45 



SO 



AATACGTGAG 
CACCTGTAAT 
CAATATATGA 
ACATATAATT 
ATTTTTGATA 
GAGGTAACGA 
AAAGTAGTAA 
ATAAGTTTGT 
CATCCATAAT 
CATATGCAAC 
ACACAAGCAT 
TCTCAATAAG 
GATATATACC 
TAAATGCTGT 



GCTTTTTTAA AATCTATTTT CAATACAACT TTCGAGATTG 
ACGACCGTAT TAATCATTAG CAAGATTGCT AACATCTTAG 
CCTATACTTA TTGTTTCAAA CTGATCCTTT AGTCTAATAG 
AATTCACCCA TCATGATGAT ACTGAACCCC GAAATCAATA 
AAAAGTAATT TATAACTGCG AAATATATTC ATTATTTGTA 
TGCCTCTTGT GATCACTTTG CTTTACTTGA TTTCGGTCTT 
ATAAAGAGTA CAATTAAAAA TATACAAGCT GCTATTAAGA 
CCATACATCA AGCCACCTAA CAATGCCCCA ATAGCTACCG 
CTAATCTTGT AAATATAATG TTCCACGTCT f CGGTAATTG 
ATAACTGGAA ATTGTAATCC CCAAACGATT GTAAATATGG 
ATAATTTGCC ACAATTGATG TGACCCAAAT ACGCCCATGA 
GTCGCTTGAT AAATAAGTAC TAGCAACTTT tTCGGAAATA 
ATAATGGACA ATGGAAATTT nAGAACCACT AAACCAACAA 
TGACTTAACA TATCTGTTAA ATATAGTGGT ATAAACGGTA 
AGCTGTAAAA nATTGCTAAT CAATCGTACT TTCAA 
(2} ,INF0RMATI0N FOR SEQ ID NO: 207: 

. (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1539 base pairs 

(B) TYPE: nucleic acid 

" K " (C) STRANDEDNESS : dotlble 
(D) TOPOLOGY: linear 



T (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 207: 
AAAAAAAAAA AAAAAnGGTG AATCTTTAAT TAAACACTAA TATTGTAAAA 
AAACGCTTAA TGACACTTAT TTTTTGAAAA TAATAGTAAT ATCATTTTGT 
AATAAAGCTA TAATmATTAT AGAATAACTA TTTAAAGGAG ATTATAAACA 
TACAGATGTT TACGCTCGCG AAGTCTTAGA CTCTCGTGGT AACCCAACTG 
AGTATTAACT GAAAGTGGCG CATTTGGTCG TGCATTAGTA CCATCAGGTG 
TGAACACGAA GCTGTTGAAT TACGTGATGG AGACAAATCA CGTTATTTAG 
T ACT AAAG CA GTTGAAAACG TTAATGAAAT CATCGCACCA GAAATTATTG 
TTCAGTATTA GATCAAGTAT CTATTGATAA AATGATGATC GCATTAGACG 



TAaAATGACG 
ATCATATGAA 
GGAGATTGAA 
ACGGTCTTTC 
ACGACTTG CA 
AATATATAAA 
CATACTGTAG 
CATCCAATAG 
TAATGTGTCC 
ACAAAAACCA 
TATCACCATC 
GTAACCAGAT 
GACAATTGAT 
CGTAATAATT 



GATGTTAAGT 
TAAATGAAAG 
TGCCAATTAT 
TTGAAGTAGA 
CTTCAACTGG 
GTAAAGGTGT 
AAGGTGAATT 
GTACTCCAAA 



28740 
28800 
28860 
28920 
28980 
29040 
29100 
29160 
29220 
29280 
29340 
29400. 
29460 
29520 
29555 



60 
120 
180 
240 
300 
360 
420 
480 



55. 
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10 



15 



20 



25 



30 



AGCTGACTTA 


TTAGGTCAAC 


CACTTTACAA ATATTTAGGT 


GGAi 11 AA i\» 




enn 

DUU. 


ACCAGTACCA 


ATGATGAACA 


TCGTTAATGG 


TGGTTCTCAC 






660 


CCAAGAATTC 


ATGATTTTAC 


CTGTAGGTGC 


TAGAAGGTTC 


AAAGAATCAT 


TACGTTGGGG 


720 


TACTGAAATT 


TTCCACAACT 


TAAAATCAAT TTTAAGCAAA 


CGTGGTTTAG 


AAACTGCAGT 


780 


AGGTGACGAA 


GGTGGTTTCG 


CTCCTAAATT 


TGAAGGTACT 


GAAGATGCTG 


TTGAAACAAT 


840 


TATCCAAGCA 


ATCGAAGCAG 


CTGGTTACAA 


ACCAGGTGAA 


GAAGTATTCT 


TAGGATTTGA , 


900 


CTGTGCATCA 


TCAGAATTCT 


ATGAAAATGG TGTATATGAC TACAGTAAGT TCGAAGGCGA 


960 


ACACGGTGCA 


AAACGTACAG 


CTGCAGAACA AGTTGACTAC 


TTAGAACAAT 


TAGTAGACAA 




ATATCCTATC 


ATTACAATTG 


AAGACGGTAT 


GGACGAAAAC 


GACTGGGATG 


GTTGGAAACA 


1UOU 


ACTTACAGAA 


CGTATCGGTG 


ACCGTGTACA ATTAGTAGGT 


GACGATTTAT 


TCGTAACAAA 




CACTGAAATT 


TTAGCAAAAG 


GTATTGAAAA 


CGGAATTGGT 


AACTCAATCT 


TAATTAAAGT 


1200 


TAACCAAATC 


GGTACATTAA 


CTGAAACATT 


TGATGCAATC 


GAAATGGCTC 


AAAAAGCTGG 


l^bU 


TTACACAGCA 


GTAGTTTCTC 


ACCGTTCAGg 


aAACAGAAGA 


TACAACAATT 


GCTGATATTG 


1320 


CTGTTGCTAC 


AAACGCTGGT 


CAAATTAAAA 


CTGGTTCATT 


ATCACGTACT 


GACCgTATTG 


1380 


CTAAATACAA 


TCAATTATTA 


CGTATCGAgA 


TGAATTATTT 


GAAACTGCTA 


AATATGACGG 


1440 


TATCAAATCA 


TTCTATAACT 


TAGATAAATA 


ATTTTCTnTA 


TAATCAAATG 


CTGACATAAT 


1500 


TTTAGTTGAG 


GATTATTATG 


ACGGT ATAAA 


TAAATAAAG 






1539 



(2) INFORMATION FOR SEQ ID NO: 208: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 846 base pairs 
35 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

40 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 208: 
CAATTTCTAT CTATCAATGA TGTGCATACT TCCAnTTAAA TTAAtCGAAA TGaATCAAGG 60. 
TATATCATTC CTGCCTCTTT ATATAACaAC AAATAGTGAT TACAATATTT CGGTTATTAA 120 

45 

CACGAAAATT TTACAAG CAC CTATTTCATT TACATATATA TACAGCAAAA AAGAAAGCCC 180 
AGAAATATTG GTGTTTATTA AATCATTTAA AAAGTATATT GCCAATGAAC AATT AT AAT A 240 
AATTTCAAAT CTAAAAAACC AAGAATGCGA TTAATCATCA CATTCTTGGT TCAATTTTAT ... 300 

SO 

TCATGAATTT TTTCAACATT AAACGTTAAG TTATTGTCTG AATTTAAATT AACTTTAATC 360 

55 - ■ 
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CGTTGTACAA AACGTTTTAA TGGTCTTGCA CCGTATTGAG GTTCATAAGC TTCTTGACCT 4 80 

AGCCAAGCTT TAGCATCATC AGAAACTTCA ATTGAGATTC GTTGTTCTAA TAATCTTATA 540 

5 TTTAATTGCG TTAAGATTTT ATCTACAATC ATACTCATGT CATCAATAGA TAATGGTTTA 600 

AATAATACGA TATCATCCAT ACGATTCAAA ATTTCTGGTT TGAAATATGC ATTTAAACTT 660 

GTCATAACAG CTTTTTCTGT TGATTCTGTA ATTTCACCAG TCTCTTTTAC GTTTTCTAAT 720 

10 AAAACTTGAG ATCCAATATT ACTTGTCATA ATAATAATAG TATTTTTAAA ATCAACGCTA 780 

CGTCCTTTAG AATCAGTTAA ACGGCtTCAT CTAAAATTTG CAATAATACA TTAAAGACGT 840 

CAGTAT 846 



15 

<2) INFORMATION FOR SEQ ID NO: 209: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1674 base pairs. 

(B) TYPE: nucleic acid 
20 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 209: 



40 



45 



SO 



nTGGGAACAG 


TAAGCCAGTA 


TTTTTAGAAA 


GTTGCCATAC 


ATGAGCGTCG 


ATTTTTCCAA 


60 


TATGGCTATG 


ACACTAGAAC 


AATGGGAATT 


TGGAGGAAAA 


GTAAATGATT 


AAACCTAAAA 


120 


TAGCATTAAC 


CATTGCAGGT 


ACTGATcCaA 


CAGGTGGTGC 


03GCGTAATG 


GCTGATTTAA 


180 


AATCATTTCA 


TTCATGTGGT 


GTATATGGTA 


TGGGCGTCGT 


TACAAGTmTT 


GTTGCTCAAA 


240 


ATACATTGGG 


CGTACAACAT 


ATTCATAATT 


TAAATCATCA 


ATGGGTAGAT 


GAACAACTTG 


300 


ATAGTGTCTT 


CAATGATACC 


TTACCTCATG 


CTATTAAAAC 


GGGGATGATT 


GCTACAGCAG 


360 


ATACTATGGA AACGATTCGT 


CATTATTTAA 


TGCAACATGA 


ATCTATTCCA 


TATGTAATtG 


420 


ATCCTGTTAT GTTGGCGAAA rCggTGATTC 


ATaATGGwTA 


ATGACaCAAg 


CaAAACTTGC 


480 


AGCATaCGTT 


ATTGCCATTA 


GCTGACGTAG 


TAACAC CGAA 


TTTACCAGAA 


G CTG AAG AAA 


540 


TAACGGGACT 


AACCATTGAT 


AGTGAAGAAA 


AAATTATGCA 


GGCTGGCCGC 


ATCTTTATTA 


600 


ATGAGATTGG 


TAGTAAAGGT 


GTCATCATTA 


AAGGCGGTCA 


TTCAAATGAT 


ACTGATATAG 


660 


CAAAAGATTA 


TTTATTTACT 


AACGAAGGTG 


TTCAAACATT 


TGAAAATGAA 


CGATTTAAAA 


720 


CAAnACATAC 


GCATGGAACA 


GGGTGTACAT 


TTTCAGCAGT 


TATAACGGCA 


GAACTTGCAA 


780 


AAGGTAGACC 


ATTATTTGAG 


G CTGTACACA 


AGGCTAAAAA 


GTTTATTTCA 


ATGAGTATAC 


840 


AATATACGCC 


TGAAATCGGC 


CGTGGTAGAG 


GTCCAGTGAA 


TCATTTTGCA 


TATTTAAAGA 


900 
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TfiTTATAOAA 




TAAAAATTTT 


ACAGCGAATG 


GTXTATTAAG 


TATTGGTGCT 


1020 






TGAGTGAAGC 


TCCCGAAGAA 


GCTGAAGAAT 


TTTACAAAGT 


TGCACAAGCG 


1080 


5 


PTATTA A TP A 
V« X AX X nrlX 


ATATrrayrAr 1 


TTTAACAGCA GAAAATGAAC 


AAGATATTAT 


TGCGATTGCT 


1140 






ATY3 ArtflP Artn 


CTTACCTATT 


GTATTTGACC 


CTGTAGCTGT 


TGGTGCTTCT . 


1200 


10 






1AAA1 In! X A 


TTGAAATCAG 


CGAAAGTATC 


AGTAATTAAA 


1260 




l>Lwvvilnl X 


AGCGTTGATT 


GATGATACAG. CAACTATGAA 


AGGTACAGAT 


1320 






nlWl XvatnXV7\» 


GGTTGCAATA 


GCGAAAAAGG 


tTACGCAACA 


tatAaaactg 


1380 


15 


GAATAGTAAT 


CACAGGTAAA 


GAGGACGTTA 


TTGtTCmAGA 


TAATAAAGCC 


TTCGTATTAG 


1440 




CTAATGGATC 


TGCATTATTA 


GCACGAGTAA 


CTGGAGCTGG 


TTGTTTATTA 


GGAGGCGTTA 


1500 




TTGCTGGATT 


TTTATTTAGA 


GAAACAGAAC 


CAGACATAGA 


AGCGTTAATT 


GAAGCGGTAA 


1560 


20 


GCgkATTTAA 


TATTGCTGCT 


GAGGTAGCTG 


CTGAAAATGA 


AAATTGTGGT 


GGTCCTGGTA 


1620 




OGTTTTCACC 


ATTGTTGCTT 


GATACGTTAT 


ATCATTTAAA 


TGAAACAACC 


TATC 


1674 



(2) INFORMATION FOR SEQ ID NO: 210: 

25 

. <i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2232 base pairs 

(B) TYPE : nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 210: 



45 



ATGAGTTGCC 


GATGAATTTA 


GCACCACCAA 


CGATTGCnTT 


TGATACTGTG 


TCCCAACCAG 


60 


CTTGTTTAGC 


ATATTTAATA 


CCTTCACGTA 


AAGGATCGTT 


ATCATATGCA 


GCAATACCAA 


120 


ATACGTTATG 


GTATTTCGTG 


TTTGAGTTAG 


TTACAACTTT 


GTnTTGCACT 


ACATCTGCAC 


180 


CTTTCGCTAA TTGAGAAGTA 


CCGTTACCTG 


TTTCTAATAG 


GGCATGTGAG 


ATAAGATAAA 


240 


CTTCATTAAT 


GCCATACATT 


TGAGCAGCTT 


TGTTAAATGC 


AGCACCTTGG 


TTTTCTAATA 


300 


CACCTTTACC 


TTTTAAGAAT 


TGATTAATTT 


TATCAATAGA 


AATATTTTGT 


GGTTGGTCTA 


360 


AGCGTAAGAA 


TTGATATTTT 


AATGCTGGAT 


CTTGAGCTAA 


ACGCTTCGTA 


TCCATTGCAT 


420 


GCTTAACATC 


ATTAAATTTA 


GCATCTGTCC 


ACTTACCTGG 


TACACGTTGT 


ACTTGTGGTT 


480 


TATATTGTAA 


ACCAGCTTGT 


ATTTGAGCAA 


CTTGGTTTAA 


TGTCATACCT 


GTTTGATTAT 


540 


ACTTAATTAA 


TTCTTTAGCT 


AAATCAGTTG 


ATTTAATCCA 


TGCtAATTTA 


CCGTTAGATA 


600 


ATTTACCATA 


GTACCAAGTT 


TGTCCATTAA 


TGACTTGTTC 


TTTAACAACT 


GCGAATGGTT 


660 
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AACCATTACC 


ATTTTTAATT 


ACATAAGTGT 


AGTTATAATC 


TTTGGc AG CT 


GATGTAGTTG 


780 




GTTTCACAGC 


AGTTGGTGCA 


GTTAAATCTT 


TTGCATTTAC 


CCAACCAGTG 


CGGTTATTAA 


840 


5 


TAGTACCGTA 


TAAATAAACA 


TCTTTGCCTA 


CAGATACTTG 


TTTCGTTGCA 


TTAAATGTAC 


900 




CTTGAGCAAT 


GTTATTGCCT 


GTTAAAATGA 


CTTGGTTTTT 


AGTACCCCAA 


GGAACCATTG 


960 


10 


ATAAGCCGTT 


ATTTGATTTA 


TTAACAGTAT 


ATTTTTGAGT 


CGTTTTAACT 


TCTTTGCCTA 


1020 




AGTTTTGAAC 


ATTTAAGTCT 


TTTACATTGA 


ACCAACCTAA 


TGGGATGTTA 


TGGCTTGTAT 


1080 




TGTTTAATAA 


TACATACGTT 


TCATTACCAT 


GAGCACGCTC 


TTTTGTTACA 


TAGAACGTAC 


1140 


1S 


GGTCTGCATA 


TTTCGCACCG 


TTTTTCGCTG 


TTTTTTCATA 


AACAGAAGCA 


CGAATACCAG 


1200 




TCTTGTTTGG 


TTTAACTTGA 


GCAATCTTGC 


TAACTGTTTG 


AGTCGTTTGT 


GGTTTAGTAA 


1260 


20 


CAGTATAAGC 


TTTTACAGCT 


GTTTTTGGTT 


GTGCTACTGC 


ttttttaggt 


GCAGCAGGTA 


1320 


CAGCTAAATA 


TGCTTTACTT 


ACCCAACCAG 


ATTTACCATT 


TACAGTTCCA 


AATAAATAGA 


1380 




TAGATTTATC 


AATTTGTTGT 


TGCTTAGTCG 


CTTTAAAAGT 


TTGGTTACCT 


GTACCAGAAA 


1440 


25 


CTGCACCAGC 


TTCTTGTTTA 


TAAGTGCCCC 


AAGGTACTGA 


ATATAATTTA 


GTGCCTGGgT 


1500 




TTACTGTATA 


TGTTTGCATT 


ACATTTACAG 


GTGATTTTGC 


ATtGtTATAA 


ATACGTCACC 


1560 




TTGTTTAACC 


CAACCAATTA 


AAGTTGGACT 


ATTGTAATCT 


TTAACTAAGT 


AGAATTTGTT 


1620 


30 


TCCACCTAAA 


CTTGCTTCTT 


TTGTTACAGC 


AAATGTTTTT 


TGAACTTCTT 


TCGTTGGCTT 


1680 




ACCAGTTTTG 


TCATAAACTG 


TAGTGAATAA 


GCCATTGTTT 


TT AG CATT AA 


TTTGAGCAAC 


1740 


35 


ACCGTTTAAT 


GATGAAACTG 


TTAATTTATT 


ATTTGTTGTA 


GGTGTTGATG 


GCTTAGGTGT 


1800 


TGGTGTAGGC 


GTAGGTTTAG 


CAGTATCAAC 


TAAATATGCT 


TTACTTACCC 


AACCAGATTT 


1860 




ACCATTCACA 


GAG CCATAT A 


AATAAATTGA 


TTTATCAATT 


TGTTGTTGCT 


TTGAAGCCTT 


1920 


40 


AAATGTTTGG 


TTTCCAGAGC 


CAGACACACT 


ACCAGCAACT 


TGTTTAGATG 


TACCCCAAGG 


1980 




TACTGTATAA 


AGTTTCGTAC 


GAGGTTTGAT 


TGAATATGAT 


TGATTTACAT 


TTACAGGTGA 


2040 




TTTAGCTGTG 


TTGTAAACCA 


CATCGCCTTC 


TTTAACCCAA 


CCAAATTTAT 


TACCAGAATT 


2100 


45 


GTAATCTTGA 


ACAAGATAGA 


ATTTTTGATT 


ACCTAATGTA 


GCTGTTTTAG 


ATACAGCAAA 


.2160 




TGTTTTTTGA 


ACTTCATTAG 


TTGCTTTACC 


AGTTTTGTCG 


TATACAGTAG 


TATATAAACC 


2220 




ACTATTTGTT 


GG 










2232 



SO 

(2) INFORMATION FOR SEQ ID NO: 211: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2082 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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<xi) SEQUENCE DESCRIPTION: i 
GATTTAAATA AAATTAATGG ATATCGTGAT 
GGAATG CGTG TATCTGAATT GATACATTTA 
TTTGTACGCG TATTTGGTAA AGGCGATAAA 
ATTGAGTACT TAACTACTTA TATTGAAACG 
ACTGAAGTCT TATTTTTAAA TATGCATGGT 
ATGATTAAAC AAAATGGTGT AAAGGCAAAC 
CGCCACTCTT TTGCGACACA TTTATTGGAA 
ATGTt AGG t C ACTCTGaCmT ATCTACTACC 
ATTAGAAAAA TGTATAACCA ATTTCATCCT 
CACAATACAC ATGACTAAAA ATGTCTGTGC 
TTACGTCTAT GTTTTCTTAA TTGAATCGCT 
TCACGGCGCA TGTGATGGTC TACAATAAAA 
TAGTCTGGAT AGTTGGCCTT GATGATGCGT 
GATGAAAAAG GCTTTGCTGC ATTCAATTTT 
TCATTTAAAT TAAGGTATAA CGCATCTCTA 
TTATTAAAAG ACTTATAGGC GCCTTTTAAA 
GCAAACAAGA TTAAACTAAC AACTGCATCT 
GCATCTTCTA AAATGTCATG ACATAGGAAA 
AAA1TTATCA GTGCCTGTTG CATTTTGTTA 
TGCTATAATA TTTTAGAGAA TTATGCACAT 
GAAGTTAAAT TAGATGCTTT CAATGGACCA 
TTTGAAATAG ATATTTATGA TATTCCTATG 
GTTCATGCAA TGAAACAGCT TGAAATTAAT 
GAACTCTTAA TGATTAAAAG TAAGATGCTA 
GATGATGACC CACGGGAAGA TTTAGT t GGG 
TATACTGCtA TTTTAAATGA CATGAAAGAA 
GACAGATTTA TCtCATTTGG AAAcAGATGA 



3EQ ID NO: 211: 

CGTACGATGT TAGAACTTCT GTACGCAACG 
GAGTTAGAAA ACGTGAACTT AATAATGGGA 
GAAAGAATTG TACCATTAGG CGACGCAGTC 
ATTAGACCGC AACTTTTAAA AAAGACTGTT 
AAACCTTTAT CACGACAAGC AATATGGAAA 
ATTAAAAAGA CGTTAACGCC ACATACGTTA 
AATGGCGCAG ATTTAAGAGC AGTGCAAGAG 
CmaCTCTATA CmCATGTTTC GrAATCTCAA 
AGAGCATAAA GTGAACAATA ACTCAAAAGT 
TATTGTGGCT TTTTTAAATT GGTTGATTAA 
TCTTCTTTTG CTGCAATCAC TTCTGAACGA 
GGATCTGTTG CTGTTTCCTG ATTATAATCA 
TCAAAGACTG GAGTTATTGG TAATATAACA 
GCAATCTGTT GCTCAATTAA CAACTGATAA 
TCTTTAGCAT * TTTGTATTAT TTCTTTAGAT 
TTATTGCGGC GATAATGGTA ACAAGCAGTT 
TGCTTACTGT AGTTATTTTC AGCTTTCCAT 
TAATGTTGCT TAGTATGAAA TTGATAATAG 
TCACCCCAAT TTAAAAGTAA GTTATTTTCA 
ATGACGCAAT ACGAGGTAGA TATTATGTAT 
TTAGATTTAT TGCTGCATCT TATCCAAAAA 
CAAGCATTAA CAGAGCAGTA TATGCAGTAC 
ATTGCAAGTG AATACCTAGT ATTAGCGTCA 
TTACCACAAT CAACATCAGA TATGGATGTT 
CGTTTAATAG rATATCaAAA TTATArAGAA 
GAAAGAGATT TTTATTTTAC CAAAAAGACC 
ATCyTGGGAT CCaAATCATA CGATTGATTT 
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ATCTGTTGAA ATCCGAAAAG AGACATTTAC CATTCAACAA GCTACAGAAC AAGTGACATC 1740 

GAGATTGAAA GATAAAGATC ATTTTAACTT CTTTAGTCTG TTTACGTTTT CTGAGCCAAT 1800 

5 

TGAACAAGTA GTCACTCACT TTTTAG CTAT TTTAGAGATG TCAAAAGCAG GAATAATTAA I86 0 

TATTGAGCAA CAACGTAATT TTGAAGATAT TAACATTATT AGAGGAGTGA ACTACCATTT 1920 

1Q TGGATAATCA TGGTATATTA GAGTCGCTTT TATTTACAGC TGGCGATGAA GGTTTAGATG 1980 

AAAAACAACT ATTAGAAATA TTAGATATGT CGAAAGACCA ACTCGTTGAA TTAATTGAAA 2040 

ATTATTCATC ACATGGATTA ATGATACAAC GATTTGGAAT GA 2082 

1S (2) INFORMATION FOR SEQ ID NO: 212: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4219 base pairs 

(B) TYPE: nucleic acid 
20 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION : SEQ ID NO: 212: 

25 

TCTATTCTCG TTCTTCCAAG ACCCTGaATT AGAAGTTAAG AAAATCGAAG AAGATGAGAA 60 

AGAATCTATT AAAAAAGCTC AAAAAGGTAT TTATAAAGAC CCTAGAGACA TCAATGATGA 120 

30 CGAACAAGAT GATGATACAA AAGATACTGT TGATAAAAAG GAATGATTGT AATTGCCTAA 180 

CAAAAACACT CAAGAATATT GGGAAGAACG CGGACGCAAA GCAATCGAGA ATGAGTTGAA 240 

GCGTGATAAA ACTAAAGCTG AAGAAATAGA ACGTATATTG AATATGATGA TTAAGCGCAT 300 

35 TGAAAAAGAG ATCaATGCGT TTATTGTCAA GTACGGAGAT TTTGCAGGCG TTACATTACA 360 

AGAAGCACAA AAGATTATTG ATGAGTTCGA TGTAAAAGCG TTTCAAGAAG AAGCAAAAAG 420 

ATTG^CGAA AACAAGGAGT TT AG CG AT AG AGCAAATGAA GAATTAAAGA AGTATAACAC 4 80 

40 

GAAAATGTAT GTATCTAGAG AACAGATGTT AAAGATTCAA ATAGAATTCT TAATTGCTTA 54 0 

TGCAACAGCT CAAACAGAAT TATCGATGAG GGAATATTTC GAATCAACAG CTTATCGTGT 600 

GTTCAGTGAT CAAGCGGGTA TTTTAGGTGA AGGTGTACAA GTAGCTAAAG AAGTTATAGA 660 

45 

TACAATCGTT GATACACAAT TTCATGGTGT CG TTTGGTCA GAGCGATTAT GGACTAATAC 720 

CGAAGCAATG AAACAAGAAG TAGAAGAAAT AATTGCTAAT GTAGTTATTA GAGGTCGACA 780 

SO TCCTAATGAA TATGTTAAAG ATATG CGCAA CACTTAAATA AATTCGAAGG CACAGCACGA 840 

CAAAAGACCG CAGCAATTAA ATCATTGCTT TATACGGAAT CGGCACGTGT TCACGCACAA 900 

TCAAGCATTG ACAGCATGAA AGAAATTTCA CCGGAAGgAT ATTATATGTA TATTGCAAAA 960 

55 
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GACGCTAAAA 


TTGGTGTTAA 


TTTCTATCCT 


ATGCATATCA 


ATTGTCGTTC 


AGATTGCGCT 


1080 




TTACTACCTA 


AATCTATGTG 


GCCGAAAAAA 


CCAAGCAAGA 


AACGAAAAAC 


AAAATACTTC 


1140 


5 


GGAGGGAAAG 


TGAAAAGCGG 


TGATTGATTT 


AAAAGTGAAG 


TTTTTTAAAG 


GCAAGTTAGT 


1200 




TTTGTATGAC 


AGTAAATTAA ATGTTTGGAG 


GATACTAATA 


TGAGTAATAC 


TGACAAATAC 


1260 


10 


CTTAGAGACA 


TAGCAAGAGA ATTAAAAGGT 


ATACGTAAAG 


AGTTAGAAAA 


GCGAAACGAA 


1320 


, ACAGTTATTA 


TTGATGCAAA 


CTTAGACAGT 


TTAAGGTCGG 


CAGTATTAGC 


CGATAAAGAA . 


1380 




AAATCGAAAT 


ATAATGAACC 


TCTCTTTTAA TAGCTAGCAC TTAATTGTGT TGGCTATTTT 


1440 


15 


TTATGTCCAA 


AACGTGCTGA 


TGACATAAAA 


AGCACGCATG 


GAAAAACAGT 


CGACAGACTA 


1500 




TAAATGGAGG 


TATATCTCAT 


GGAAGAAAAT 


AAACTTAAGT TTAATTTGCA 


ai-rrrrTGCA 


1560 




GACCAATCAG 


ATGATCCGGA 


CGAACCAGGC 


GGAGATGGTA AAAAAGGAAA 


TCCTGATAAG 


1620 


20 


AAAGAAAATG 


ACGAAGGTAC 


TGAAATAACT 


TTCACGCCAG 


AGCAACAAAA 


GAAAGTTGAT 


1680 




GAAATACTTG 


AACGTCGTGT 


AGCCCACGAA 


AAGAAAAAAG 


CTGATGAGTA 


TGCAAAAGAA 


1740 


25 


AAAGCAGCAG 


AAGCTGCTAA 


AGAAGCTGCT 


AAATTAGCGA 


AAATGAACAA 


GGATCAAAAA 


1800 


GATGAATATG 


AACGCGAACA 


AATGGAAAAA 


GAACTGGAAC 


AATTAGGTTC 


AGAAAAACAA 


1860. 




TTAAACGAAA 


TGCGTTCAGA 


AGCACGAAAA 


ATGTTGAGTG 


AAGCXX3aAGT 


TGATTCATCA * 


1920 


30 


GATGrGGTTG 


TCAATTTAGT 


TGTAACAGAT 


ACTGCTGAAC 


AAACTAAATT 


GAATGTTGAA 


1980 




GCTTTTT CTA 


ATGCAGTAAA 


AAAAGCGGTT 


AATGAAGCGG 


TTAAGGTTAA 


CGCTAGACAA 


204 0 




TCGCCATTGA 


CTGGTGGAGA 


TT CATTTAAT 


CACTCGACTA AAAATAAACC 


GCAAAACTTA 


2100 


3S 


GCTGAAATAG 


CTAGACAAAA 


AaGAATTATT 


AAAAATTAAC GGAGGCATTT; AAATGGAACA . 


2160 




AACACAAAAA 


TTAAAATTAA 


ATTTGCAACA 


TTTTGCAAGT 


AACAATGTTA 


AACCACAAGT 


2220 




ATTIAACCCT 


GACAATGTAA 


TGATGCATGA 


AAAGAAAGAT 


GGCACGTTGT 


TAAACGACTT 


2280 


40 


TACAACACCT 


ATCTTACAAG 


AGGTTATGGA 


AAACTCTAAA 


ATCATGGAAT 


TAGGTAAGTA 


2340 




CGAACCAATG 


GAAGGTACTG 


AGAAGAAGTT 


TACTTTTTGG 


GCTGATAAAC 


CAGGTGCTTA 


2400 


45 


CTGGGTAGGT 


GAAGGTCAAA 


AAATCGAAAC 


GTCTAAGGCT 


ACTTGGGTTA 


ATGCTACAAT 


2460 


GAGAGCGTTT 


AAATTAGGGG 


TTATCTTACC 


AGTAACAAAA 


GAATTCTTGA 


ATTACACTTA 


2520 




TTCACAATTC 


TTTGAAGAAA 


TGAAACCTAT 


GATTGCTGAA 


GCTTTCTATA 


AAAAGTTTGA 


2580 


SO 


CGAGGCAGGT 


ATTTTGAATG 


AAGGTAACAA 


TCCGTTCGGT 


AAATCAATTG 


CACAATCAAT . 


2640 




TGAAAAAACT 


AATAAGGTTA 


TTAAAGGTGA 


CTTCACACAA 


GATAACATTA 


TTGATTTAGA 


2700 




GGCATTGCTT 


GAAGATGACG 


AATTAGAAGC 


AAATGCATTT 


ATCTCAAAAA 


CACAAAACAG 


2760 
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TGATTCGTTA GACGGTCTAC CTGTGGTTAA CCTTAAATGA AGCAACTTAA AACGTGGTGA 2880 

ATTAATCACT GGTGACTTCG ACAAATTGAT TTATGGTATC CCTGAATTAA TCGAATACAA 2940 

5 AATCGATGAA ACTGCACAAT TATCTACAGT TAAAAACGAA GATGGCACAC CTGTAAACTT 3000 

GTTTGAACAA GACATGGTGG CATTACGTGC AACTATG CAT GTAGCATTGC ATATTGCTGA 3060 

TGATAAAGCG TTTGCTAAGT TAGTTCCTGC TGACAAAAGA ACAGATTCAG TTCCAGGAGA 3120 

10 

AGTTTAATAA ATAATTAGGA GTGGTAACAT GCCCGAAATC ATTGGAATTG TTAAAGTAGA 3180 

TTTTACAGAT TTAGAAGATA ACAGACATGT CTATATGAAA GGGCATGTCT ACCCTCGTAA 324 0 

1S AGGTTATAAT CCTACAGATG AACGTATCAA AGCTTTAGCT AGTGTTGAAA ATAAACGCAA 33 00 

CAAACAAATG ATTTACATTG TAAATGACAA ATTAACGAAA AAAGAACTTG TCGAAATAGC 33 60 

AAGTGTTGCT GGCTTACAAG TTGATGAAAA ACAAACAAAA GCTGAAATTA TCAATGCTTT 3420 

20 TGAGTCACTA GAGTAGGTGG TTATATGACT ACGCTAGCTG ATGTAAAAAA ACGTATTGGT 34 80 

CTTAAAGATG AAAAGCAAGA TGAACAATTA GAAGAAATCA TAAAAAGTTG TGAAAGCCAG 354 0 

TTGTTATCAA TGTTACCTAT TGAAGTTGAA CAAATACCGG AAAGgTTTAG TTACATGATT 3600 

25 

AAAGAAGTTG CAGTTAAACG CTACAACAGG ATTGGTGCTG AAGtATGACA TGAGAAGCGG 3660 

TTGACGGACG TAGCAATGCG TATGAATTGA ACGATT t CAA GGAGTATGAA GCTATTATTG 3 720 

ATAAITACTT TAATGCTAGA ACGAGAACTA AAAAAGGAAG GGCTGTGTTC TTTTGAGATA 3780 

30 

TGAAGATAGA GTTATTTTTC AATTAGAACA AGTAGCAACT TACAATCCTA AAAGTAGCAA 3 84 0 

AAAAGAAAAC ACACTAATCA CTTATGATGC GATACCATGC AATATTAACC CCATTTCTAG 3 900 

55 AGCAAGAAAG CAACTTGAAT TTGGTGATGT AAAAAACGAT GTAAGTGTTC TGAGGATAAA 3960 

AGAATCAATA TCTTACCCTG TTAGCCACGT GTTGGTTAAT GG CATTCGCT ACAAGATAGT 4 020 

TGAT&CAAGG ATATACAGAC ACGAAACGTC ATATTATATC GAAGAGGTCA ATTGATGAAT 4080 

40 ATAGATGGAT TAGACGCACT GTTAAACCAA TTTCACGATA TGAAAACCAA GATTGATGAT 414 0 

GATGTAGATG AtATTTTACA GGAAAACGGC AAAGAATATG TAGTACGAGC TAAATTGAAA 4 2 00 

GCTAGAGAAG TAATGAATA 4219 

45 

(2) INFORMATION FOR SEQ ID NO: 213: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1999 base pairs 
so (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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GCTTACAAGT ATATTCATAA TTACATATTC AAGGTCCTTG CATGTGGTAT TTTGCTATGG 60 

yC t TTaACTA CAACGGGGTC TAAGACTGCG TTTATCATAT TAATCGTCTT AGCCATTtAT 120 

TyCTTTATkA AAAAGTTATT TAGTAGAAAT GCGGTAAGTG TTGTGAGTAT GTCAGTGATT 180 

ATGCTGATAT TACTTTGTTT TACCTTTTAT AATATCAACT ACTATTTATT CCAATTAAGC 240 

GACCTTGATG CCTTACCGTC ATTAGATCGA ATGGCGTCTA TTTTTGAAGA GGGCTTTGCA 300 

TCATTAAATG ATAGTGGGTC TG AG CG AAGT . GTTGT ATGG A TAAATGCCAT TTCAGTAATT 360 

AAATATACAC TAGGTTTTGG TGTCGGATTA GTGGATTATG TACATATTGG CTCGCAAATT 420 
AATGGTATTT TACTTGTTGC CCATAATACA TATTTGCAGA TCTTTG CGGA ATGGGGCATT - 480 

TTATTCGGTG CATTATTTAT CATATTTATG CTTTATTTAC TGTTTGAATT ATTTAGATTT 540 

AACATTTCTG GGAAAAATGT AACAGCAATT GTTGTAATGT TGACGATGCT GATTTACTTT 600 

20 TTAACAGTAT CATTTAATAA CTCAAGATAT GTCGCTTTTA TTTTAGGAAT TATCGTCTTT 660 

ATTGTTCAAT ATGAAAAGAT GGAAAGGGAT CGTAATGAAG AGTGATTCAC TAAAAGAAAA 720 

TATTATTTAT CAAGGGCTAT ACCAATTGAT TAGAACGATG ACACCACTGA TTACAATACC 780 

25 

CATTATTTCA CGTGCATTTG GTCCCAGTGG TGTGGGTATT GTTTCATTTT CTTTCAATAT 840 

CGTGCAATAC TTTTTGATGA TTGCAAGTGT TGGCGTTCAG TTATATTTTA ATAGAGTTAT 900 

CGCGAAGTCC GTTAACGACA AACGGCAATT GTCACAGCAG TTTTGGGATA TCTTTGTCAG 960 

30 

TAAATTATTT TTAGCGTTAA CAGTTTTTGC GATGTATATG GTCGTAATTA CTATATTTAT 1020 

TGATGATTAC TATCTTATTT TCCTACTACA. AGGAATCTAT ' ATTATAGGTG CAGCACTCGA 1080 
3S TATTTCATGG TTTTATGCTG GAACTGAAAA GTTTAAAATT, CCTAGCCTCA GTAATATTGT :■ 1140 

TGCGTCTGGT ATTGTATTAA GTGTAGTTGT TATTTTTGTC AAAGATCAAT CAGATTTATC 1200 

ATTGTATGTA TTTACTATTG CTATTGTGAC GGTATTAAAC CAATTACCTT TGTTTATCTA 1260 

TTTAAAACGA TACATTAGCT TTGTTTCGGT TAATTGGATA CACGTCTGGC AATTGTTTCG 1320 

TTCGTCATTt AG CAT ACTT A TTACCAAATG GACAGCTCAA CTTATATACT AGTATTTCTT 1380 

GCGTTGTTCT TGGTTTAGTA GGTACATACC AACAAGTTGG TATCTTTTCT AACGCATTTA 1440 

ATATTTTAAC GGT CGCAATC ATAATGATTA ATACATTTGA TCTTGTAATG ATTCCGCGTA 1500 

TTACCAAAAT GTCTATCCAG CAATCACATA GTTTAACTAA AACGTTAGCT AATAATATGA 1560 

50 ATATTCAATT GATATTAaCA ATACCTATGG TCTTTgGTTT AATTGCaATT ATGCCATCAT 1620 

TTTATTTATG GTTCtTTGGT GAGGAATTCG CATCAACTGT CCCATTGATG AC CATTTT AG 1680 

CGATACTTGT ATTAATCATT CCTTTAAATA tGTTGaTAAg CaGGCAATAT TTAtTAAtAG 1740 
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TATGTAyTAT TTTGATATAT TTTTATGGAA TTTACGGTGC TGCTATTGCG CGTTTAATTA 
CAGAGTTTTT CTTGCTCATT TGGCGATTTA TTGATATTAC TAAAATCAAT GTGAAGTTGA 
ATATTGTAAG TACGATTCAA TGTGTCATTG CTGCTGTTAT GATGTTTATT GTGCTTGGTG 
TGGTCAATCA TTATTTGCC 

(2) INFORMATION FOR SEQ ID NO: 214: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 7769 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 214 : 
TCATTATTAA GACTATTATA TATAATGAAT TTTAACTGGT TTATTAAACG AGAACGTCGG 
GAATT AAGTA ACTACAATAA AAATAAGATA TGACAATAAG GAGACTACAC GCGTGATCAT 
TGCCATAATT ATATTGATAT TT ATTTCGTT TTTCTTTTCA GGAAGCGAGA CGGCATTAAC 
GGCTGCCAAT AAAACAAAAT TTAAAACTGA AGCTGACAAA GGTGATAAAA AAGCAAAAGG 
CATTGTAAAG TTACTTGAAA AACCAAGTGA GTTTATTACA ACGATTCTAA TTGGGAATAA 
TGTCGCGAAT ATTTTATTAC CAACACTTGT TACAATTATG GCTTTACGTT GGGGGATTAG 
CGTTGGTATT GCATCAGCTG TTTTAACAGT TGTTATCATT TTGATCTCCG AAGTGATTCC 
CAAGTCTGTC GCTGCAACAT TTCCAGATAA AATAACAAGG CTTGTATATC CAATTATTAA 
TATTTGTGTC ATTGTGTTCC GTCCTATCAC ATTACTTTTA AATAAGTTGA CGGACAGTAT 
TAATCGAAGT TTATCTAAGG GCCAACCTCA AGAACATCAA TTTTCAAAAG AAGAATTTAA 
AACAATGTTA GCAATTGCTG GACATGAAGG TGCTTTAAAT GAAATTGAGA CGAGTAGGTT 
GGAAGGTGTC ATTAATTTTG AAAATTTAAA AGTAAAAGAT GTAGATACAA CACCTAGAAT 
TAATGTGACG GCATTTGCTT CAAATGCGaC ATACGAAGAA GTTTATGAAA CGGTTATGAA 
TAAGCCATAC ACTAGATATC CAGTGTACGA GGG AG AT ATT GATAACATTA TTGGGGTGTT 
TCATTCTAAA TATCTGTTGG CTTGGAGTAA TAAAAAAGAA AATCAAATTA CAAACTATTC 
AGCTAAGCCA TTATTTGTGA ATGAACACAA TAAAGCTGAA TGGGTATTAC GTAAGATGAC 
TATTTCTAGA AAACATTTAG CAATTGTGTT GGACGAATTT GGTGGTACTG AAGCGATAGT 
GTCACATGAA GACTTAATTG AAGAATTATT AGGTATGGAA ATTGAAGATG AGATGGATAA 
AAAGGAAAAA GAAAAACTTT CTCAACAGCA AATTCAATTT CAACAACGG A AAAATCGCAA 
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GTATTGAATA 


TCCAATTATA 


CAAGCAGGTA TGGCAGGAAG 


TACGACACCG 


AAATTAGTTG 


1260 




CATCAGTAAG 


TAACAGTGGT 


GGGTTAGGCA 


CAATAGGCGC 


AGGTTACTTT 


AATACGCAGG 


1320 


5 


AATTGGAAGA 


TGAAATAGAT 


TATGTACGCC 


AATTAACGTC 


AAATT CTTTT 


GGCGTAAATG 


1380 




TCTTTGTACC 


AAGTCAACAA 


TCATATACCA 


GTAGTCAAAT 


TGAAAATATG 


AATGCATGGT 


1440 


10 


TAAAACCTTA 


TCGACGCGCA 


TTACATTTAG 


AAGAGCCGGT 


TGTAAAAATT 


ACCGAAGAAG 


1500 


AACAATTTAA 


GTGTCATATT 


GATACGATAA TTAAAAAGCA AGTGCCTGTA 


TGTTGTTTTA 


1560 




CTTTTGGAAT 


TCCAAGCGAA 


CAGATT AT AA 


GCAGGTTGAA 


AGCAGCGAAT 


GTCAAACTTA 


1620 


IS 


TAGGTACAG C 


AACAAG TGTT 


GATGAAGCTA 


TTGCGAATGA AAAAGCGGGT 


ATGGATGCTA 


1680 






AGGTAGTGAA 


GCAGGTGGAC 


ATCGTGGTTC 


ATTTTTAAAA 


CCTAAAAATC 


1740 




A A TT A P PT AT 


GGTTGGAACA 


ATATCTTTAG 


TGCCACAAAT 


TGTAGATGTC 


GTTTCAATTC 


1800 


20 


pra"2TPA ttgp 


PGPTGGTGG A 


ATTATGGATG 


GTAGAGGAGT 


TTTGGCAAGT 


ATTGTCTTAG 


1860 




fiTrsPAG a agg 


GGTAPAAATG 


GGCACCGCAT 


TTTTAACATC 


ACAAGACAGT 


AATGCATCAG 


1920 




7V * fTZl PTGPfJ 
Mnl* 1 aw X 


Art ATG r* A ATT 


ATAAATAGTA 


AAGAAACAGA 


TACAGTCATT 


ACAAAAGCGT 


1980 


25 


TT Af3Tf2G A A 21 


nmYZ P A PGP 


GGTATCAACA 


ATAGGTTTAT 


CGAAGAAATG 


TCCCAATACG 


2040 




21 21 GGPG AT 21 T 


PP P AG A TT AT 
LUUnun X XAX 


CCAATACAAA 


ATGAGCTAAC 


AAGTAGCATA 


AG AAAAGC CG 


2100 


30 


P21 nP 21 A 21 P 21 T 


PGGPGAPAAA 


GAGTTAATAC 


ATATGTGGAG 


TGGACAAAGG. 


CCGCGACTAG 


2160 


P21APAAPGP21 


TPPPGPPAAP 


ACCATCATGT 


CCAATATAAT 


CAATCAAATT 


AATCAAATCA 


2220 




TGPAATATAA 


AT AAT CGA.CC 


GCAATCCACA 


AAAGCACAAG 


CACCCCCAAA 


CATTATTTTA 


2280 


35 


VliUVa X X V3V<Wl 


TTTTTGTGGA 


TTG CGTTTCT 


ATTTTACCAA 


TTTAATCAAA 


CGAAAACATC 


2340 




AAG CTGAAGA 


TCGCCGAAAG 


ATTTTAATCA 


AGCAAAAACA 


TCAAACTAAA 


GTTCGCTGAA 


2400 




ATGATTATGA 


TAAAAGTTAT 


ATGGTATGAT 


GACATTGGTG 


AT AT AT ATGA 


TAAACATCGG 


2460 


40 


ATTAACAGGT 


TGGGGTGATC 


ACTATTCATT 


ATATGAAGAT 


TTAGAACGCC 


AAACCGATAA 


2520 




ACTTAAAACA 


TATGCTGGAC 


ATTTTCCGGT 


TGTCGAATTA 


GATGCGACAT 


ACTATGCGAT 


258.0 


45 


ACAACCGGAA 


AGAAATATAT 


TGAAATGGAT 


AAAAGAAACG 


CCTGATACAT 


TTGAATTTGT 


2640 


GGTCAAAATT 


CATCAAGCAC 


TcACATTGCA 


TGCAGACTAC 


AAAACATTTG 


P21P ATAPA21G 


2700 




GCAAGAACTA 


TTTGATCAAT 


TTAAGAATAT 


GTTAGAGCCC 


TTACATACAC 


AGAAAAAATT 


2760 


50 


AGCAATGGTA 


TTGGTTCAAT 


TTCCGCCATG 


GTTTGACTGC 


AATGCACAAA 


ATATCAAATA 


2820 




TATTTTGTAT 


GTAAGACAGC 


AATTACAAGC 


ATTTCCAATG 


TGTGTAGAAT 


TTAGGCATCA 


2880 




ATCATGGTTT 


AGTGATGCAT 


TTAAAGAACA 


AACATTGGCA 


TTTTTAACAG 


AACATCAAAT 


2940 
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AATCACAAAT GAAATTGCGT TTGTACGTTA TCATGGACGT AATCATTACG GTTGGACTAA 3060 

GAAAGATATG TCAGATCAAG AATGGCGCGA TGTACGCTAT TTATATGATT ATAATGAGCA 3X20 

AGAATTAATA GACTTGGCAC AAAAGGCACA AATATTAGCA CAAAAAGCTA AGAAAGfTTA 3180 

CGTCATATTT AACAATAATT CTGGTGGTCA TGCAGCAAAT AATGCCAAAA CATATCAGCG 3240 

ATTATTGAAT ATAGAATATG AAGGGTTAGC ACCACAACAA TTAAAATTAt TTTAAGAGGC 3300 

GACGACTATG TT ATT AACAA TTACATTATT AGTTTTAATC GGAGGTTTGT CAGCGATTAT 3360 

AGGGTCTATC GTAGGCATTG GAGGCGGTAT TATTATCGTT CCAACAATGG TTTACCTCGG 3420 

TGTTGAACAT GGATTACTAC ATAATATTAC AACACAAGTA GCGATAGGGA CGTCTTCAGT 3480 

CATTCTAATT GTGACAGGAC TTTCTTCATC ACTTGGATAT TTAAAAACAA AACAAGTTGA 3540 

TATTAAAAAT GGTTCCATCT TTTTATTTGG ACTATTACCA GGTTCATTGC TTGGGTCCTT 3600 

20 CATTAGTAGA TATTTAACAT TTGAGTGATT TAATTTATAT TTTGGTATCT TTTTAATTTT 3660 

CGTAGCCATT TTATTAATGG TAAGAAATAA GATTAAACCG TTTAAAATTT TCGATAAACC 3720 

CAAGTATGAA AAGACTTATG TAGACGCTAA AGGTAAAACA TATCATTATA gTGTTCGACC 3780 

ATTGTTTGCT TTTATTACAA CGTTTTTAAT TGGTATATTG ACAGGTTTAT TTGGTATTGG 3840 ^ 

AGGTGGCGCA CTAATGACGC CACTAATGCT TATTGTATTT AGATTTCCAC CTCATGTAGC 3 900 

TGTTGGAACA AGTATGATGA TGATTTTCTT TTCAAGTGTC ATGAGTTCTA TAGGGCACAT 3 i960 

TGCTCAAGGT CACGTAGCTT GGGGTTATGC AATGATllTTA ATTATTTCTA GTTATTTTGG 4020 

TGGGAAAATC GGTGTCAAAG TGAATGAATC AATTAAGTCA GATACGGTAG TAACATTATT 4080 

GAGAACAGTA ATGTTGTTAA TGGGTATATA TTTAATTATT CGTGCGTTGA TTTAATACAA 4140 * 

CTTTAAAAGG AGGACGTCAA TTTGAGGCTT ACAATTTATC ATACGAACGA TATTCATAGT 4200 T * 

CATTTACATG AATACGAACG CATTAAAGCA TATATGGCAG AACATGGGCC ACGACTTAAT 4260 

CATCCTTCTT TATATGTTGA TCTAGGTGAT CATGTAGATT TATCCGCACC TATAACTGAA 4320 

GCAACTTTAG GTAAAAAGAA TGTGGCATTA CTAAATGAAG CAAAATGTGA TGTTGCAACA 4380 

ATCGGTAATA ATGAAGGGAT GACCATTTCA TACGAAGCTT TAAATCACCT TTACGACGAA 444 0 

GCAAAATTTA TAGTGACATG TAGCAATGTT ATAGATGAAT CAGGTCATTT ACCAAATAAT 4500 

ATCG TTTCTT CTTATATTAA GGACATAGAC GGTGTGAAAA TACTATTCGT TGCAGCGACA 4560 

SQ GCACCTTTTA CCCCATTTTA TCGTG GACT A AATTGGATTG TTACCGATCC ACTTGAATCT 4620 : 

ATAAAAGAAG AAATTGAACT TCAACGAGGT AAATTTGATG TATTAATCGT GCTAAGTCAT 4680 

TGTGGCATTT TCTTCGATGA AACATTATGC CAAGAATTGC CTGAAATTGA TGTCATTTTT 474 0 

55 



25 



30 



40 



45 



960 



I 



EP 0 786 519 A2 





GCAgCTGGAA AGTATGGTAA TTATCTTGGA GAGGTTAATT 


TAACTTTTGA 


GGCACATAAA 


4860 




GTAGTACATA AAACTGCAAA GATTATTCCT TTAGAAACAT 


TACCTGAAGT 


TGAAACTTCA 


4920 


5 


TTTGAAGAAG 


AAGGAAAAAC 


GTTAATGTCC AATTCAGTAA 


TTCAACATCC 


AGTAGTGCTT 


4980 




AAGCGTAGTA 


TGAATCACAT 


AACTGAAGCT GCATACTTAT 


TAGCTCAAAG 


TGTTTGTGAG 


5040 




TAT ACACATG 


CACAATGTGC 


CATCATCAAT GCTGGCTTAC 


TCGTTAAAGA 


TATTGTAAAA 


5100 


10 


GATGAAGTGA 


CAGAATATGA CATTCATCAA ATGTTACCGC ATCCGATTAA TATGGTAAGG 


5160 




GTTAGACTTT 


TTGGTGTGAA ATTAAAAGAG ATTATAGCTA AAAGTAATAA ACAAGAATAT 


5220 


15 


ATGTATGAAC 


ATGCACAAGG 


TTTGGGTTTC AGAGGGAATA 


TATTTGGAGG 


ATATATTCTT 


5280 




TATAATTTAG 


GGTACATTCA 


TTCTACAGGG CGTTACTATC 


TGAATGGAGA 


AGAAATCGAA 


5340 




GACGACAAAG 


AATATGTACT 


AGGTACGATA GATATGTATA 


CGTTCGGTCG 


TTATTTCCCA 


5400 


20 


ACATTGAAAG AATTACCAAA AGAGTATTTA ATG CCAGAGT TTTTAAGAGA 


TATATTTAAA 


5460 




GAAAAATTAT 


TGGAATATTA 


AAAAGTAAGA TTATTGGATT 


TTCATTTGTC 


ATGAATTTCG 


5520 




ATATAATGTT 


TAAAGATACA 


CTTAACAGGA GGGTATGTGT 


TGTTATGGCG 


ACAAAAAACG 


5580 


25 


AGGAAATATT 


ACGTAAACCG 


GATTGGTTGA AAATAAAATT AAATACCAAC 


GAAAACTATA 


5640 




CAGGACTTAA 


GAAGATGATG 


AGGGAAAAAA ATCTTAATAC 


TGTATGTGAA 


GAAGCTAAAT 


5700 


30 


GTCCTAATAT 


ACATGAATGT 


TGGGGTGCAC GTCGTACAGC 


GACATTTATG 


ATTTTAGGTG 


5760 


CCGTATGTAC 


AAGAGGTTGT 


CGTTTTTGTG CGGTTAAGAC 


AGGTTTACCT 


AATGAACTTG 


5820 




ATTTAAATGA 


GCCTGAACGT 


GTAGCTGAAT CAGTTGAATT 


AATGAATTTG 


AAACACGTTG 


5880 


35 


TTATCACTGC 


TGTTGCGCGT 


GATGATTTAA GAGATGCTGG 


TTCAAATGTT . 


TATGCTGAGA 


5940 




CAGTACGTAA 


AGTTAGAGAA 


AGAAATCCAT TTACAACGAT 


TGAAATTTTA 


CCATCAGATA 


6000 




TGGGCGGGGA 


CTATGATGCG 


TTAGAAACAT TAATGGCGTC 


AAGACCTGAC 


ATTTTAAACC 


6060 


40 


ATAATATTGA 


AACTGTTCGT 


CGCTTAACAC CGAGAGTTCG 


TGCGCGTGCG ACTTACGACA 


6120 




GAACATTAGA 


GTTTTTACGT 


CGTTCAAAAG AATTACAACC 


GGATATCCCA 


ACTAAATCAA 


6180 




GTATTATGGT 


TGGATTAGGT 


GAAACTATAG AAGAAATTTA 


TGAAACGATG 


GATGATTTAC 


6240 


45 


GTGCGAATGA 


TGTAGATATT 


TTAACGATTG GTCAATATTT ACAACCTTCA CGTAAACATT 


6300 




TAAAGGTTCA 


AAAATATTAC 


ACGCCTTTAG AGTTTGGTAA 


ATTAAGAAAA 


GTGGCAATGG 


6360 


SO 


ATAAAGGGTT 


TAAACATTGC 


CAAGCTGGAC CTTTAGTACG 


TAGTTCTTAT 


CATGCGGATG 


6420 




AGCAAGTAAA 


TGAAGCTGCT 


AAAGAAAAGC AACGCCAAGG 


TGAGGCACAG 


TTAAATAGTT 


6480 




AATATTTAAC 


CATTAATAAG 


GCATAAAGGC TTAGTTTGTA 


CAAAACGAAC 


GTGTCATAGA 


6540 



55 



961 



10 



15 



20 



25 



35 



40 



45 



EP0 786 519 A2 

AGGTGAAGAA TTTGATAAAA GTAGATCAAC ATTACTTTGA ATTAATAGAA AATTATCGCG 6660 

AATGTTTTAA TGAAGAACAA TTTATTG CTA GGTATTCAGA TATTTTAGAT AAATATGATT 6720 

ACATAGTTGG TGACTATGGT TACGATCAAT TACGATTAAA AGGTTTTTAC AAAGATTCTA 6780 

ATAAAAAAGC AGAGATGAGT AAACGTTTTT CAAATATTCA AGATTACATA TTTGAATATT 6840 

GTAACTTTGG TTGTCCTTAC TTTGTATTAA GACATTTGTC TAAACAAGAG GTTAAAAAGT 6900 

TAATCGAAGA AGTTCATCCG TCTGATGTGA TAGATGACGA CAATAAACTT CAAGATGTGA 6960 

AGATTAAGCC AACCATTCAA GATACTGAAC ATTAATAAAA CCCTTAGCTA GATTGAAAAT 7020 

GGGAATCATG CAATTCAAGC ATGGACCTGT AATCTAGTTA GGGGTTTTTA TCTTTAATGA 7080 

ATGACTTCAT TTAAATACTC AGTAATTTCA TCGCCTTCTT CAG CATTTAC ACCTAAAATA 7140 

TGAGCGATAT AGCCTTCTTC TTTTAAATCA TCAGTACCGA TAATACCGAA TTTATTTGTT 7200 

TGCATATTAA GTACGAGTGT CTTACCATAA TGTCTATTTG TATGGACTAA CATCAAATCA 7260 

TATCGACTAT GCTCGCCAAC AAAACCAACA AACTGAACTT GACTCTCTTC GTTGTCATCA 7320 

TATAAATACA TATCAATCAT TTTGTAGCGA CTCCTTTTAA AAGTAGTAAA GTTAGTATAA 7380 

CGACAAATGA AGTATACTGC AAAATTATGA TAATATATAA GTGAGAGGTG ACAAGGAATG 744 0 

TATTTTGTAG ACAAAGATAA ACTAACTCAG AAATTAGCCT ATTTACAAGC ATTAACTGAT 7500 

GATTATCATG AGAGCAAGCA CAATCATTAT GCATTTGAAC GCATTGCTCA AATGTTGATA 7560 

GAATCATCGG TAGATATAGG GAATATGATT ATCGATGCAT TTATTTTAAG GGATCCTGGT 7620 

AATTATAAAG ATGTGATTGA TATATTAGAA CTAGAAAATG TTATTACTAA AGAAACACAG 76 80 

CAGGtCSATTA ATAAAACTGT CGGTATTCGT AAACAATTTA CATATGATTA CACAGCCTTA 7740 

GATGTTCJAGA TTATCATGCC AATGTTTGA 7769 
(2) "INFORMATION FOR SEQ ID NO: 215: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 644 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



50 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 215: 

ACCGCCACCC ATTAATGATT GCTTAAAATC AATAGTCGTA CCATTTAATA CGGGTGCATC 60 

TTTTTTGTCT ACTAATACTT TTAATCCAAA GTATTCTAAG ACTTCATCAT TTTCACCAGG 120 

CGCTTCTTCT GCACCCATAC CGTATGTTAA AC CAGTGCAC CCGCCACCAT TCACTTTAAT 180 
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TGCTTCTGTT AATATAACTG TTGGCATGAT AACTCCTCCT TAAAAAATCC AAGTTTCTTT 300 

TATATGTGCA TATATATTTT GTAATAATTC TTCCGGCGAA TCACCTTCAA CAATATCACC 360 

ATTTACTAAA GCATACAACC CGGCTGAACA TATACCACAA TGTGTCAGGC AACCATACTC 420 

TAACACATCG ACATCTGGGT CATTTTCCAG TTGATTAAAA ACATAATCTC CACCTTTTGC 480 

CATGTTAGAG AGACAAAATT CTACGATCGG ATTCATACTT CACCTTCTTA TTTCATTTGT 54 0 

TACAATATTA TAGCATTTTA AAACTGGTAT TTTAACATGA TGTGCTCAAT TAGCAACAAC 600 

TGATGTTTCT TATCCCAGTT ATGTAATAGT GCCTTAGTTA GTAC 644 
(2) INFORMATION FOR SEQ ID NO: 216: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 1578 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 216: 



30 



40 



45 



50 



GAATGATGAA 


AGGAATAGAA 


AAGAAAAGAT 


AAATAATGTA 


ATAGATTTAT . 


CCGAGAAAAT 


60 


TGAAAGAACA 


AAAGATATGC 


CAATCAAGAA 


TACTATAACT 


ACTCAATTAG 


GAAATAAACT 


120 


TATTGGCACA 


AAAAAAGCTC 


GTTTTGATGA 


TAAGAAAGTA 


GTGTCGTTTG 


GAGCATTTGA 


180 


AGATGAATAA 


AATAAATGAT 


AGAGATTTAA 


CAGAATTGAG 


TAGCTATAGG. 


GTTTATCAAG 


240 


ACATCAATAA 


AGATAATGAC 


TTTACAGTTA 


ACGAAAAACG 


ATTTAAGCAG 


GCAGATGTAT 


300 


TTGAAGATTT 


ATATAGAGAG 


AAACTAAAAG 


ACACAAATAA 


ATTAAGAGAG 


TATAATTATT 


360 


TACAAAATGA 


AACTTTTAAA 


AGCGCATAAA 


TAGGTGATGA 


GATATGCTTA 


AAAAAGCAAA 


420 


ATTTSTCTTA 


ATGGCAACGA 


TACTACTATC 


AGGATGTTCA 


ACTACCAATA 


ACGAATCCAA 


480 


CAAAGAAACA AAATCTGTAC 


CAGAAGAAAT 


GGATGCTTCA 


AAATATGTAG 


GACAAGGATT 


540 


CCAACCACCT 


GCAGAAAAAG 


ATGCGATTGA 


ATTTGCAAAG 


AAGCATAAAG 


ATAAAATTGC 


600 


TAAGCGAGGC 


GAACAATTTT 


TTATGGATAA 


CTTCGGTCTA 


AAAGTTAAAG 


CTACAAATGT 


660 


TATAGGTAGT 


GGCGATGGTG 


TAGAAGTATT 


CGTGCATTGT GATGACCACG AyATCGTATT 


720 


TAATGCGAGT 


ATTCCATTTG 


ATAAATCAAT 


wATTGAsAGT 


GATAGCTCAT 


TAAGAAGTrA 


780 


GGAyAAAGGy GATGATATGA 


GTACTTTAGT 


TGGTGCAGTA 


CTCAGTGGGT 


TTGAATATCG 


840 


AGCACAAAAA 


GAAAAATATG 


ATAAATTATA 


TAAATTTTTC 


AAAGATAATG 


AAGAGAAATA 


900 


TCAATATACA 


. GGATTTACAA 


AAGAAGCAAT 


TAATAAGACG 


CAAAATAGTG GTTATGAAAA 


960 
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ACCATTGTTA AACAAAAGTG ACAGTGAATT TTCAAAAGAA TTGTCAAATG TTAAGAAGCA 
ATTAAAAGAT AAGTCTAAAG TTTCGGTAAC TACTACTCTA TTTAGTAAAA AAAAGAACTA 
TACTAAAAAA AGTAACAGTG AAAATGTAAT AAAAATGGCA GAAGAAATAA AAAAAGATAA 
AGAGATACCA AACGGTATAG AGCTTAGTAT AAAATTTTCG GACAATAAAA TAAATACGGT 
TAAACCAAAT TTTAACGGTG aAAGCACTTC AGAATATGGT GTGTTTGATC AAGAATAAAA 
TTAATGATGa AAATTTAACG GAGAATAGTG TATATTGAGT AGATCmAGAA TAAAAAGATA 
ATTCTACTAT TGTTGTGAAG GCAAATAAGT AGAAGATTTT AAGTGTAATT TCTGGTGATT 
TAAATAATAA TATAnATGGn AGTACTGATA TAAnACTTTT TAACCTACTA GATTCTTATA 
ATTTGCTTTC CATTTTATGA CGATTTTTAC TCCAATTGAG TGATAGAATC CAAAAAAGCC 
ATCTCCAAAA ATTAATCC 

(2) INFORMATION FOR SEQ ID NO: 217: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5137 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 217: 
TGTTTTCCTT GGGTTAAAAC ATGCTTGCTA TGCGTTTGTA AATATGACTT GCTGTTTTnA 
CCTCnATACC CGTCACACCA TGGAAGTAAA AATGTTTCTT GCTCTTGGCT TACAATTTTA 
GCTTTAATCG CTTCATATGC TTTATATTGG TCTTCTGTT A ATTGCTGTTT TGATTCTTGT 
TCGAAAACAC GATCTTTAAA TGGGTCTCTT TCAACAACCG CGTCATATTT TTCAACATAA 
CCTTPTTTGA TAAGTCCATC TAAACTGGAT TTTGAAAAGC CCATATCCTC AATATCAGTT 
AAAAATATTG TTTTATGTTG TTCTTCAGAC AAGTAAGCAT ACAAATCGTA TTGTTTAATA 
ACTTTCTCCA ACTTAGCTAA TACTTCATCA GGATGATACC CTTCAATGAC ACGAACAGCA 
CGCTTGGTTT TTTTAGTTAT ATTTTGTGTG AGAATCGTTT TTTCTTCAAC GATATCATCT 
TTTAACAACT TCATAAGCAA TTGAATATCA TTATTTTTTT GCGCATCTTT ATAATAATAG 
TAACCATGCT TATCAAATTT TTGTAATAAA GCTGAAGGTA GCTCTATGTC ATCTTTCATC 
TTAAATGCTT TTTTATACTT CGCTTTAATA GCACTCGGAA GCATCACTTC TAGCATAGAA 
ATACGTTTAA TGACATGAGT TGAACCCATC CACTCACTTA AAGCTATTAA TTCTGATGTT 
AATTCTGGTT GTATATCTTT CACTTCTATG ATTTTTTTTA ACTTCGAAAC GTCAAGTTGT 
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ACAATTACAC GCACACCAGG TTGGATGACA GATTCGAGTT GTTCGGGAAT 


TATATAATCA 


900 




AATTTATAGT 


CAACGCTCTT 


CGACGCGACA TCGACTATGA CTTTCGCTAT 


CATTATTGCC 


960 


5 


ACCTAGTTTC 


TAGTTCATCT 


AAAATTTGTG CAGCTAATAC TAClTlTrTT 


CCTTTCTTGA 


1020 




TATTTACTTT 


TTCATTATTT 


TTAAAATGCA TTGTCAATTC ATTATCATCA GAACTAAATC 


1080 


10 


CGATAGACAT 


ATCCCCAACA 


TTATTTGAAA TAATCACATC TGCATTTTTC 


TTGCGTAATT 


1140 




TTTGTTGTGC ATAATTTTCA ATATCTTCAG TCTCTGCTGC AAAGCCTATT 


AAATACTGTG 


1200 




ATGTTTTATG 


TTCACCTAAA 


TATTTAAGAA TGTCTTTAGT ACGTTTAAAA 


GATACTGACA 


1260 


15 


AATCACCATC 


CTGCTTTTTC 


ATCTTATGTT CTAATACATC AACOGGTGTA TAGTCAGATA 


1320 




CGGCTGCTGC 


TTTTACAACA 


ATATCTTGTT CGTCAAATCG GCTTGTCACT 


TGTTCAAACA 


1380 




TTTCTTCAGC 


ACTTTGAACA 


TGAATAACTT CAATATCTTT TGGATCCTCT 


AGTGTTGTAG 


1440 


20 


GACCAGCAAC 


TAACGTCACG 


ATAGCTCCTC GATTTOGCAA TGCTTCAGCT 


ATTGCATAGC 


1500 




CCATTTTTCC 


AGAAGAACGA 


TTGGATACAA ATCTGACTGG ATCGATAACT 


TCAATAGTTG 


1560 


25 


GTCCTGCTGT 


AACCAATGCG 


CGTTTATCTT GAAATGAACT ATTAGCTAAA 


CGATTACTAT 


1620 


TTTGAAAATG 


AGCATCAATT 


ACAGAAACGA TTTGAAGCGG TTCTTCCATA 


CGTCCTTTAG 


1680 




CAACATAACC 


ACATGCTAGA 


AATCCGCTTC CTGGTTCGAT AAAATGATAC 


CCATCTTCTT 


1740 


30 


TTAAAATATT AATATTTTGC TGCGTACGTT TATTTTCATA CATATGCACA 


! TTCATAGCAG : , 


. 1800 




GCGCAATAAA 


TTTCGGTGTC 


TCTGTTGCTA GCAACGTTGA TGTCACCAAA TCATCAGCAA 


1860 




TACCTACACT CAATTTTGCA ATTGTATTTG* CCGTTGCAGG TGCAACAATO: ATTGCATCTG 


, 1920 


35 


CCCAATCACC 


TAATGCAATA 


TGCTGTATTT. GTGAAGGATT TTCTTCTATA AAAGTATCTG 


1980 




TATAAACAGC 


ATTTCGACTT 


ATTGCTTGAA ATGCTAATGG TGTCACAAAT 


TTTTGTGCGT 


2040 




GATTGGTTAA 


CATAACGCGA 


ACTTCATACC CAGATTGTGT TAACTTACTT 


GTCAAATCAA 


2100 


40 


TTG CTTT AT A 


TGCCGCAATG 


CCACCTGTAA CGGCTAATAA TATTTTCTTC 


ATATTCAATC 


2160 




TCCCTTAAAT 


ATCACTATGA CATTTACGCT TTACATCATC ATATGCGCAC 


AAATGCTCAT 


2220 


45 


TAcrrriTTA 


TAGATACAAA 


TTTAGTATTA TTATAACATC AATCATTGGA 


TAAACTAAAA 


2280 


AAACACACCT 


ACATAGGTGC 


GTTTGATTTG GATATGCCTT GACGTATTTG 


ATGTACGTCT 


2340 




AGCTTCACAT ATTTTTAATG 


GTCGAAACTA TTCTTTACCA TAATAATCAC 


TTGAAATAAC 


2400 


50 


AGGGCGAATT 


TTACCGTCAG 


CAATTTCTTC TAACGCTCTA CCAACTGGTT 


TAAATGAATG 


2460 




ATATTCACTT 


AATAATTCAG 


TTTCAGGTTG TTCATCAATT TCACGCGCTC 


TTTTCGCTGC 


2520 




AGTTGTTGCA ATTAAATACT 


TTGATTTAAT TTGTGaCGTT aATTGGTTtA AAgGTGGATT 


2580 



5$ 
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TTTArGTGcT CAGCTTCTAC AATACATTGA ATTCtATTCy TCGcAAGtTC TACTTCAtCA 
TTAACTACAA cGTAAyCGTA TAAATTCATC ATTTCrACTT CTkTACGCGC yTCGTTAATA 
CGACTTTGTA TTTTCTCATC AGATTCTGTT CCTCTACCTA CTAATCGCTC TCTCAAGTGT 
TCTAAACTTG GAGGTGCTAA GAAAATAAAT AGCGCATCTG GAAATTTCTT TCTAACTTGC 
TTTGCACCTT CTACTTCAAT TTCTAAAAAT ACATCATGAC CTtCGTCGAT TGTAT CTTTA 
ACATATTGAA CTGGTGTACC ATAATAGTTG CCTACATATT CAGCATATTC TATAAATTGG 
TCATCTTTGA TTAAAGCTTC AAACGCATCC CTAGTTTTAA AAAAGTAATC TACGCCATCA 
ACTTCACCTT CACGCATTTG ACGTGTTGTC ATTGAAATAG AATACTTATA TGATGTACTT 
GGATCTTCAA ATATnCGTnT TCTAACAGTA CCTTTACCTA CTCCAGATGG TCCTGATAAA 
ACGATTAACA ATCCTTTTTC ATTATCCATG CCTTACGACC TCTCTAAGCT AATCTTCTAT 
TATTTAAATA TGATATCACA TTGTT CTTTA TATTGTATAG CATATTTGAA ATTGCATGCC 
ATAATTTCTA TTAAGTCTAA CAATATCGTT ATATTGCACG ATTAATTTTA ATTAAATAAA 
TTGAATTGCA AACTTTTAGA TAATGTAAAA TGTATGGCAT AATGTATGGT TCAATAACTA 
TACTGAAAAG TTACAATCAT GTTAAAATGA AACGAATGAT ATGAAGAAGG TGGAAGATAA 
ATTATGGCTT ATGATGGCTT ATTTACAAAG AAAATGGTTG AGTCTCTACA ATTTTTAACA 
ACAGGACGTG TTCACAAAAT CAATCAACCT GATAATGACA CGATACTAAT GGTTGTACGT 
CAAAATAGAC AAAACCATCA ATTGTTATTG TCAATCCATC CAAACTTTTC AAGATTACAA 
TTGACTACTA AAAAATATGA TAATC CATTT AATCCACCCA TGTTTGCGCG TGTTTTTAGA 
AAACACTTAG AAGGTGGTAT TATCGAATCG ATTAAGCAAA TTGGTAATGA TCGTCGCATT 
GAAATCGATA TAAAGAGTAA AGATGAAATT GGCGATACTA TTTACCGCAC TGTCATCCTT 
GAGATTATGG GTAAACATAG TAACTTAATT TTAGTAGATG AAAATCGCAA AATAATTGAA 
GGATTTAAAC ACTTAACACG AAATACGAAT CACTATCGTA CAGTAATGCC AGGATTTAAT 
TATGAAGCAC CACCTACTCA GCACAAAATA AATC CGTATG ATATTACAGG TGCAGAGGTG 
TTGAAATATA TCGATTTTAA CGCAGGTAAT ATTGCTAAAC AATTATTGAA TCAGTTTGAA 
GGATTTAGCC CTTTAATTAC GAATGAAATC GTTAGTCGTC GTCAATTTAT GACTTCATCA 
ACATTACCAG AAGCATTTGA CGAAGTAATG GCAGAAACCA AGTTACCACC TACTCCTATT 
TTTCATAAAA ATCATGAAAC AGGTAAAGAG GATTTCTATT TTATAAAGTT AAATCAATTT 
AATGATGATA CAGTTACATA CGATTCATTA AATGATTTGC TTGATCGTTT TTATGATGCG 
CGTGGCGAAC GTGAACGCGT TAAACAACGT GCGAATGATT TAGTTCGATT TGTTCAACAG 



2700 






2760 






2820 






2880 






2940 






3000 






3060 






3120 






3180 






3240 






3300 






3360 






3420 






3480 




V 


3540 


H? 




3600 




■ • 


3660 






3720 






3780 




'-'it 


3 84 0 






3900 






3960 






4020 






4080 






4140 






4200 - 






4260 






4320 






4380 
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ATAAAGATAC 


TGAACAGTTA 


TATGGTGAAT 


TGATCACTGC 


TAATATATAT 


CGAATTAAGC 


4500 




AAGGCGATAA 


AGAAGTGACG 


GCATTGAATT 


ATTATACGAA 


TGAAGAAGTT 


GTCATTCCTT 


4560 


5 


TAAATCCTAC 


AAAATCCCCA 


TCAGCAAATG CTCAATATTA TTATAAACAA TATAAyCGTA 


4620 




TGAAAACGAG 


AGAmCGTGAA 


TTACAACATC 


AAATTCAATT 


GACGAAAGAC 


■ \ 

ft ft T & T*ft P ftTT 


4680 


10 


ATTTTTCAAC 


AATCGAACAA 


CAATTACATC 


ATATTTCTGT 


CCATGACATT 


GATGAAATTA 


4740 




GAGATGAATT 


AGCAGAACAA 


GGCTTTATGA 


AACAGCGTAA 


AAATCAAACT 


AAGAAAAAGA 


\ 4800 




AAGCGCAGAT 


TCAATTACAA 


CATTATGTAT 


CAACTGATGG 


CGACGATATA 


TATGTTGGTA 


4860 


15 


AGAATAACAA 


GCAAAATGAT 


TATTTAACAA 


ATAAAAAAGC 


TAAAAAAACT 


CACAGATGGT 


4920 




tACACACAAA 


AGATATTCCT 


GGTTCACATG 


TCGTTATATT 


TAATGATGCA 


CCAAGTGATA 


4980 




CGACAATCAA 


GGAAGCGGCT 


ATGTTAGCAG 


GATACTTTTC 


AAAAGCTGGT 


AATTCTGGAC 


5040 


20 


AAATACCTGT 


TGATTATACA 


TTAATTAAAA ATGTGCATAA ACCATCaGGT 


GCAAAGCCTG 


5100 




GGTTTGTAAC 


ATATGACAAT 


CAAAAAACTT 


TGTATGC 






5137 



(2) INFORMATION FOR SEQ ID NO: 218: 

25 

. (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2267 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
30 (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 218: 
3S GTTTTATCGC AGCAGTAAAG CTATCAATCG GCGGTTCAAT TGATGATGCA 1 TTAGCAGAAA 60 

TCAnACAATC ATTTTAGTTA AAATTTACTA ATAATGAaAA ATGTAAACCT TTTTCAAATG 120 

AAACTTTATa AaAAATATGA TAGTATATAT GTAAATGTTT AATAAAATCT GGAGAAATAG 180 

40 1 1 

GAGGACATTG CCATGCAACA CCTTATAAAA AAACATGTAT TGAATGGCGA GTTTGATTTA 240 

GTACGACAAT TGATGTCCGA AACAGATTTT ATGGAATTTG AAGAAGCATA TATTTCAAGT 300 

GCGGATGAAG TAGAAAGTAT G ATGTTTT AT ACATGTATTT TAGATATGAT TAAGTACGAA 3 60 

45 

GAATCATCTG AAATGCATGA CTTAGCATTT TTATTGCTTG TGTATCCACT AAGTGAATAT 420 

GAAGGTGCTT TGGATTCTGC TTATTATCAT GCAGACGCTT CCATAAAACT TACTGACGGC 480 

50 AAAGAAGTTA AAAGTTTGTT ACAAATGTTA TTATTGCATG CGATACCAAC ACCTGTTATT 540 

TCAGATAAGA AGGCTTTTGA TATCGCCAAG CAAATTTTAA AATTAGATCC TAATAATAAT 6 00 

GTTGCTCGTA ACGTCTTAAA AGAGACTGCC AAACGTATGc gACAaCGTTG TTGTTGATAT 660 

55 
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AGTTTTAACA TTTGGTTGGG TTGGGCATAT GTTCCAGCCT TTTTTAATAC TTAAAAACTA 780 

ACGAAgTATA CTTGTGTGCA CAAATGGTTT TTATACAACA TTTTATAAAT TTATACATTT 840 

5 

TAATAAAGAA CATACGATAG ATGGTTTAAA GCTTGTTAAC TGAGAAATTT TGATATGTAT 900 

TCTTCGAAAT TTAACTAAAT ATACGAAATT CAAGAAGCAC AATAATTAAT C A TTTTTCCT 960 

1Q ATACAAAAGT TCGTATGACT GCATTATAAA AGCATAAATT TATAATTTTT TTAAATGTCA 1020 

TTGAACGTGA TAATGTGAAT GGATTGAGCA ATTTTGAAAA AGTGAAAAAT AACCTATGCG 1080 

ACTTGCAATT AATTTTCAGT ACGTTATAAT GCACACTGTG CAAAATTAAG GAGGTCTATT 114 0 

1S ATTCACATGA TGATGAaTAA AGAAGCAACA AAAATTGGAT TTGCCTACGT CGGCATTGTA 1200 

GTGGGCGCAG gATTTTCAAC TGGACAAGAA GTTATGCAAT TTTTCACTAA ATATGGCTTG 1260 

TGGGCTTATT TAGGTGTTAT TATATCTGGT TTTATTTTAG CTTTTATTGG GCGCCAAGTA 1320 

20 

GCAAAAATTG GTACTGCCTT TGAAGCGACA AATCATGAAT CAACATTACA ATACGTATTC 1380 

GGTGAAAAGT TTAGTAAAGT CTTTGaTTAT ATTTTAATCT TCTTCTTATT TGGTATAGCT 1440 

GTAACCATGC tAGCTGGTGC AGGCGCAACA TTTGAAGAAA GTTATAACAT AC CTACATGG 1500 

25 

CTAGGTGCTT TaATTATGaC ATTAGCGATT TATATTACGT TGCkATTAGA CTTTAATAAA 1560 

ATAGTACGTG CACTAGGTAT CGTTACACCA TTTTTAATTG TTTTAGTTGT ATTAATCGCT 1620 

30 GGCGTTTATT tATTTAAAGG TCATGtTTCA TTAGCAGAAG TTAACCAAGT AGTGCCtGAA 1680 

GCAAGTATTT GGAAGGGAAT CTGGTTTGGT ACAATATATG GTGGATTAGC TTTTTCTGTA 1740 

■ • - GGTTTTAGTA CCATCGTAGC AATCnGTGGG GATACTGAAA AGCGTACAGT GTGAGGTGCA 1800 

55 7£:GGCGCGATGT ATGGTGGTAT TATCTATACT GTATTACTAG CATTGATCAA CTTTGcATTG 1860 

CAAGTGaATA TCCAACTATT AAAAATGCCT CAATTCCTAC ATTGACGTTA GCAAATAATA 1920 

TCCATCCTTT AATAGCAACA GTGkTATCTG TTATTATGCT GGCGGkTATG TATAATACTA 1980 

40 

TTCTAGGACT AATGTATTCA TTTGCAGCAC GTTTTACAGA ACCATACAGT AAAAATTATC 2040 

ATATCTTTAT TATTATAATG ATGGTAGCAG GTTATTTATT AAGTTnCGTA GGATTTGCTG 2100 

AATTAATTAA TAAGTTATAT ACnATTTATG GGATATGTAG GCTTATTnTA TTGTAGTAGC 2160 

45 

TGTAATTATn AAATATTTCC AAACGTAAAA ATGGCGGATA AAAAACATAT TGGTTTAATA 2220 

TCATATGGAG GGGATATCCG AAACTTTACA ATTTGAATCA CTTTGGT " 2267 
SO (2) INFORMATION FOR SEQ ID NO: 219: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 6336 base pairs 

(B) TYPE: nucleic acid 

« (C) STRANDEDNESS : double 
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10 



15 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 219: 

GTCAATGTAA CCTAATAGTT TATGTCTATC TTGTGTACCA ACTACTACAT CGACACCAGG 60 

AATTTCCATA ATTTCAGCTG ATGAAGTTTG CGCATAACAA CCTGTTACAC AGATTACAGC .120 

ATCAGGATTT TGTCTTATTG CAOGTCTAAT TATTTGACGA CTTTTTTTAT CACCCGTATT 180 

CGTTACTGTA CAAGTATTAA TAACAAATAC ATCAGCATTC GCTTCAAAGT, CAACGCGCTC 240 

ATAGTTTGCT TCTTTAAATA ATTGCCAGAT TGCTTCAGTT TCATAATGGT TTACTTTACA 300 

ACCTAATGTG TGaACGCAAC TGTTGACATA AATATTCACC CCATTAATTC TTTTTCATAA .360 

CTTATTGCAC TTAACGCATA CAATGGCGCA GTTTCTGCCC GTAAAATTCT CGGCCCAAGA 42 0 

CCAACAACTG TACTAGTATT ACTAAATAAT GAAATTTCAT TTTCTGACAA ACCACCCTCA 480 

20 GGaCCAAAAA TCATCAACAC TTTATCCTGA GCATTGAATT GTTGTAAAGT TTGCTTGAAA 540 

TTGCTTAACT CACCATCTTT TGCTTCCTCT TCATATGCAA TAAGAATATA GTCATAATTA 600 

TCAATAGTAT CACAAATTAA TTTTAAATTC GACTCGAATT GAATAGATGG AATCACTAAA * 660 

CGATAGCTTT GTTCAGCAGC TTCTTTAATT ATTTTTTGCC AACGCTCTAT CTTTTTGGCA 720 

ACTTTTGCCT CGTTTAATTT AACAATTGAA CGTTCCATGC TCACAGCTAT AAATGATGAA 780 

GCACCCAATT CAGTAGCTTT TTGTAGCAAC CACTCATATT TGTCAGCTTT GATTAGTCCA 840 

CTGCAAATCG TAACATCAAC TGGCAATTCT GTATTAATAT TTTGTTTTTC TTTTAAATCA 900 

ACTTCAATTT TATCACTTGT TATGTCAGCA ATTTCACATA. AATAAACTGT TTGATCATTA 960 

35 AAAGTTAAAA TAATTTTACT ACCAACATCA TATCTCATTA CATTTGTTAT ATGATGAATA ,1020 

TCTTCTTTTT TTGTAATAAA AAAACGCTGA CTTACATCAG CGTTTTGGnT CTATGAAATA 1080 

ACGTXGCACA TTATTCACTC ACTTTCTGGC CAACAAGACA AACCCAACCG TTGTCATGTT 1140 

GTTCTGAAAT AATTTTAAAA CCTACACGCT CCATATGTGA CTGTATACCT TCATACTTCT 1200 

CTTTTATAAT ACCAGAAGTA ATAAAATAAC CGCCTTCATT TAGAGTATTA TAAGCATCTT 1260 

CAATCATTTC ATCAATAATA TGCGCTAAAA TATTTGCTAT TACAATATCA AATTTTTCTG 1320 

TTTCGTCTTT CAATAAGTTA CCTGGAACAG CTTCAATTAA CGTTTCACAA TGATTTCTTC 1380 . 

TGAAGTTTTC TTTAGCTACA CTCACTGCCA TTTCATCAAT ATCCAACGCT TTAATACGTT 144 0 

TTACACCGAT TAGATGACTT GCAATACTTA ATATACCTGA GCCAGTACCA ACATCAATTA 1500 

CTGAATGCTG TGGCAATACA TATGTTTCTA TTGCCTTCAA ACACATACTT GTAGTCGGAT 1560 

GATCACCTGT TCCAAAAGCC ATACCTGGGT CGAGCTCAAT GCAAAGCTCT TCATCCGCTT 1620 



25 



30 
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GGAAATAGTT TTTCCATTCA TTTTCCCAAT CCGTCTCTGC AATAATTTGC TCACTGAATT 1740 

GAACGTTATG TTGATCAAGT TCATCTAAAT TTAATAACTC ATCTTTAATT TGCTGTCGCA 1800 

ACTTATCATC ATAAGTCATT TCATTAAAAT AGGCTTTCAA TCTTACTCCC TTATCTGGAT I860 

AATCCTCTTT TTTCAAAGCG TAAATTTCAC CGTATTTATC TTCTGGTTGG TTAATTAAAT 1920 

CATCTGAATC TTCTATCACG ACACCATTTG ATCCATGATT TTCAAGTATA TTGGTAGCCA 1980 

ATTCTACTGC TTCATGATTA ATAATAATTG AAAGCTCTGT CCAGTTCATA CTTTATTCTC 2040 

CCTTAAAGAA TCTTTTTGCT CTATCTTTAA AATTCGAAGG TTGTTCATTA ATTTCTTCAC 2100 

CATTTAATTG GGCAAATTCT TTCATTAGTT CTTTTTGTCT ATCTGTTAAT TTAGTAGGCG 2160 

TTACTACTTT AATATCAAGA. TATAAATCTC CGTATCCATA GCCATGAACA TTTTTTATAC 2220 

CCTTTTCTTT TAAGCGGAAT TGCTTACCTG TTTGTGTACC AGCAGGGATT GTTAACATAA 2280 

CTTCATTATT TAATGTTGGT ATTTTTATTT CATCGCCTAA AGCTGCTTGT GGGAAGCTAA 2340 

CATTTAATTT GTAATAAATA TCATCACCAT CACGTTTAAA TGTTTCAGAT GGTTTAACTC 2400 

TAAATACTAC GTATAAATCA CCAGCAGGTC CTCCATTCAC GCCTGGAGAG CCTTCACCAG 2460 

CTAATCTAAT TTGTTGTTCA TTGTCGACAC CTTCAGGTAC TTTCACTTCT AATTTAACTG 2520 ' 

TTTTATTTTC AGTACCTTTT CCGTGACATG TTGGACAAGC TTCTTCAAAT TCTTGACCAC 2580 

TTCCATTACA TTTAGGACAA ACTTGTTCAG TACGAACTCT ACCTAAAATT GTQTTTTGTT 2640 

CTACAGGTAC ATGACCAGCG CCATTACAGT AACTACAAGT CTTTTTACTT GTTC CAGGCT 2700 

TTGCACCATC ACCATGACAT GTTTCGCATG TTACATCTTT ACGGATTGAA ATTTCTTTTG 2760 

TTGTACGAAA TACCGCTTCT TCAAATGTTA ATGTCATTGT ATACTGAAGA TCATCACCTT 2820 

TTTGCGGTGC ATTTGGATCT CTTTGTCTGC CGCCACCGAA GAAAGAGCTA AAGATATCTT 288 0 

CAA7V5CCGCC GCCACCGAAG CCACTAAAAC CGCCAAAGTC AGAGCCATTG AATCCTTGTC 2940 

CACCAAAACC TTGTGGACCA TCATGTCCAA ATTGATCATA GcTTGCGCGT TTATTATCAT 3000 

CACTTAAAAC TTCATAGGCT TCAGAAATTT CTTTAAACTT TTCATCTGCA CCTTCTTCTT 3060 

TGTTAATATC TGGATGATAT TTTTTCGAAA GCTTTCGATA CGCTTTTTTG ATTTCATCTT 312 0 

TTGAAGCATC CTTACTAATG CCTAAAACTT CAT AAT AAT C TCTTTTGGCC ACAGCTATCT 3180 

CTCCTTTTCT TAATTAACTC ATATAGTTTA ACGTAATATG TCATACTATC CAAATAAAAA 324 0 

GCCAAAGCCA ATGTTCTATT GACTTTG ACT TTTCAGATCA TG ACAACATT CTAATTGTAT 3300 

TGTTTAATTA TTTTTTGTCG TCGTCTTTTA CTTCTTTAAA TTCAGCATCT TCTACAGTAC 3360 

TATCATTGTT TTGACCAGCA TTAGCACCTT GTGCTTGTTG TTGCTGTTGA GCCGCTTGCT 3420 
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TATCTTCTAT ATCTTGACCT TCTAAAGCAG 
ATTTTTTATC TTCTTCACCG ATATTTTCGC 
ATACTAGACT GTCAGCTTCG TTTCTTAAGT 
CAGCGTTAAC TTCAGCATCT TTTACCATAC 
TTGATTGAAT TGTAATTCTT TGTTCTTTAT 
CAATACCGTT TTTATCGATA TCAAACGTTA 
GTGGAATATC AGTCAATTGG AATCTACCAA 
CACCTTGTAA TACGTGTACA TCTACTGATG 
GAGATTTAGA TGTAGGAATC GTAGTGTTAC 
AAATTTCAAT ACCTAAAGAT AGTGGTGTTA 
CTGTGATAAC GCCACCTTGG ATTGCAGCTC 
CTTTGTTAGG CXCTTTACCG ATTTCTTTTT 
TTGATCCACC AACTAAGATA ACTTCATCGA 
TTGCTTGGCG TGTAGGTTCC ATTGTTCTTC 
TAGAACGAGT TAAGTTTACT TCTAAGTGTA 
GTAATGAGAT TTGAGTTTGT GATACACCTG 
CTTTCAAACG TTGTAATGCC ATTTTATCTT 
ATTCTGCAAC TAGGTAGTCA ATAATTACTT 
CACCGGCTGT TGATAGTACT TCGAATACAC 
ATGTACCGCC ACCTAAGTCA AAAACAAGAA 
CATATGCTAA TGCTGCAGCT GTTGGTT CAT 
TTTTACCAGC ATCTTTAGTT GCTTGACGTT 
TTACAGCTTT GTCAACTTTC TCACCTAAaA 
AAATCATAGC TGAGATTTCT TGTGGTGTGT 
CAGTACCCAT ATGACGTTTA ATAGATTGAA 
TTGCTACTTC aCCAACTTGA GTTTCTCCAT 
GTGAAC CTTC AGGGTTTTGA ATTACTTTTG 
AATTTGTTGT ACCTAAGTCT ATACCAATAA 
TCATTAAATT AATTTAATTT TAAACAATGT 



TTTTAAGAGC 
CTAAATCAGT 
CTACTTCTTC 
GGTCGATTTC 
TTGTACCTAA 
CTTCAATTTG 
GTGTTTTATT 
GTTGATTATC 
GTTCAATTAA 
CGTCTAATAA 
CCATTGCCAC 
TGACAGCTTC 
TATCTGAGTT 
TAATTAATGA 
ATGGACCGTT 
ATAAGTCTTT 
GAGATAAGTC 
GGTCAAAATC 
CGTCACCTAA 
CTTTTTCATC 
TAATGATACG 
CAGCATCGTT 
TAgTTTCAGC 
ATGATTTACC 
CAGTGTTTGG 
TTTTGAAAGC 
GCTCATCGCC 
TTTTACTCAT 
CTTTTCGCCA 



GTCTTTTTTC 
TAAAGTTTTT 
ACGACGTTTT 
TTCGTCTGAT 
GTCTTTTGCA 
AGGTTTACCA 
ATCCGCAGCC 
TACTGCTGTT 
CGTATTCATA 
TACTACGTCT 
TACTTCGTGC 
TTGTACTGCT 
TGTTAAGCCA 
ATCTGATAAT 
TTCACCAGCT 
TTTAGCTTTT 
TACGCCATTT 
ATCACCGCCA 
TTCTAGGATA 
TTTATCAGTT 
CTCAACTTCT 
AAAGTATGCA 
TGTATTTTTT 
TTCAATATCT 
GTTTGTAATA 
TACAACAGAT 
TTCTAATAcT 
AATAAAATTC 
AATTTAAGTT 



TCTTCAGCAG 
TCAACTTGGA 
TTATCTGCTT 
AATGAAGAAC 
GTTACATTTA 
CGTTCAGCTG 
ATTGGACGTT 
GAATAGATTT 
CGTCCACCTA 
TTAACGTCAC 
GGGTTTACTC 
GGAATACGAG 
GCGTCTTTCA 
TCTTCAAATT 
GAGATAAATG 
TCAGCAGCAT 
TCTTTTTTGA 
AGTTTGTTGT 
GATACGTCAA 
TTGTCTAAAC 
AAACCAGCAA 
GGTACTGTAA 
AAGTTTTGTA 
ACTTTATAAT 
GCTTGACGTT 
GGTGTTGTAC 
GTnACACATG 
CTCCATTTAA 
ATTGGTTTAC 



3540 

3600 

3660 

3720 

3780 

3840 

3900 

3960 

4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 

4500 

4560 

4620 

4680 

4740 

4800 

4860 

4920 

4980 

5040 

5100 

5160 

5220 
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AGTGATTTCG CCAGATTCAA AATCAGGGTT ATCATCTTGA ACTACAGCTT GGTGAATATT 5340 

TGGATCAAAT GCTTCACCTT CAGTTTTAAT AACTTCAAGA CCATTATCTT TTAGTGCGTT 5400 

5 

AATCAAACTT TCATGCACCA TTTGTACACG TTTTTGAAGA GATTTAAAAG TCTCATCATC 5460 

ACCTTCAATT TGAAGTGCAC GTTCTATATT GTCTATTGCT GGTAAAATAT CTGTTAACAC 5520 

10 ACGTTGTGCT TGATATGTTT TGTTTATTTC ATTTTCTTTT TGAATTCTAC GCTTATAATT 5580 

TTCAAACTCA GCGTAGAGCC TTAAATATTT CTCTTCGTTT TCATCTGCTA ATTGTTGAAG 564 0 

TTCATTAATT TTTTGATCTT TTGGATCTAT TTCTTCAATA ACATTCTCGT CAGACGTTTC 5700 

15 TTCTATTGCT TCATCTTGTA AATGACCTTT ACTTTCTTCA GCTTGTTCAA CTGAATCATC 5760 

AATATTTTGT TTGACGTTTG TTTCTTCAAC TGTTGATTCA GTGTTTTTTT CAACTGATTC 5820 

GTCTTTATTT GTCATTTTCT GTCCTCCAAT ACTTTCTAAT CCATCATTAC CAAATTCTAT 5880 

20 

TTAATAATTG AATGACATTT TGATAATGCA TAGCTGTAGG TGCAATCACA GCGATTTGAC .5940 

CTTTTAACGT TTCATCAAAA TGATATTGAC TTGTTACAAT TGAAATATCA CTTAAGCTGT 6000 

CATCAATTTC ATTACCAATT TTTACATTAA TATTTGGTGA AGATATATCT TGTAATAATT 6060 

25 

CTGCAATTCT ATTTGATTCT ATATATTGT A GAATGGGCTG AATTGAAGAT ACATTACTTT 6120 

CATTCAATGC ATCAATAAGT TTAACCTTTC CACCCATATA AATGCTATTA CTTTGATTAG 6180 

30 AAATATGATT ATTCATCGTA TTTAACAATT TATTGATAAA AATTTCTTCC TGCTCTGATT 6240 

GAaCAAAAGA GACAATATCA TCTTGTAAAT TCTGATTAAA CTCAGTTAGT TTGTTTGTAA 6300 
CAAAATTTGA TATTGTATTT AGTTTGTCAT TATTAA .6336 

35 (i)^INFORMATION FOR SEQ ID NO: 220: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13059 base pairs 

(B) TYPE: nucleic acid 
40 "J (C) STRANDEDNESS : double 

<D) TOPOLOGY: linear 

45 - Cxi) SEQUENCE DESCRIPTION: SEQ ID NO: 220: 

TTCATGATTA TTATCTGTTG TAGACACTGC TGGATCTTCC GATGTATCTT TCGATGCATC 60 

TTTCGATTTG TGTATTTGCT GATTCAAATG GTCTAGGTCT TCTAACGCCT TATTTACCAT 120 

so TGCTTCATCA TTTTTATCAT CTTTTTCTCC ATGTTTTGTT GTAGCCGTTT GTGACATATC 180 

ATTTTTCATT GCATTAAGAT CGTCCTCGCC ACTTTGTTGA CCCCTATCAA CATTTGAAGA 240 

AACCTCATTT AAATCTTTAA GCAATTGATC TAATTTACTG TCTATATCAC TTTGACCGTT 300 
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TTCATCTATT 


TGCGATGCTG 


TTTTCGGTTC 


ATTTAGTTGT 


GCTTTATAAT 


GTTCTTTAGA 


420 


5 


TGAAGCCGAT 


AACTGTTTTA 


ATTGCTCAAT 


TTGACGAATT 


GCCTTGTCAA 


CTTTGTCTAA 


480 




TAAATCTTGC 


TTAGATAATA 


TCTCTTTTGT 


AATTTCAGTA 


TCCTTTTCAG 


ATGCAGCTTG 


540 




GGCATCGTAC 


GGCAAGATAT 


TCGTTAAAAT 


GATACTTGTC 


GCCATCATTG 


TCGAACACGA 


600 


10 


TAACTTTACA 


TATAATTGAA 


ACGGTTTCCC 


TCGATATTTA GCCATCAACA 


TACTCCTTCC 


660 




TCACTTACTT 


CCTTCAAAGA ATTACATACT ATTATATACC TGTTTACAAG 


AAATTTACAC 


720 




TTATCTATCT 


AGTTATTGTT 


GTTAGTAATT 


ATCTACTTAT 


TACTTAGCTT 


ATATTTAAGT 


780 


15 


AAACAAAACA 


AGCATGACGT 


AATATCATAT 


TGTCCATGTC 


GCTAACATCA 


TATTACGTCA 


840 




AATCTTTTAT 


ATTAAATGAT 


GTTTTATTTT 


AGACTGCTTT 


TTCCTTTTAG 


CTTTCGAGCG 


900 


20 


CCTGTTTAAA AACTTGCTCG 


AATTGTTCAC 


GCGAGATTTC 


GTGTGCATGT 


GCTTTTTGTG 


960 


CTAATAAAGC 


ATCTCGAAAC 


TGTTGTTGAT 


CTTTCAAACT 


TTCTAACATT 


TGTATTAATT 


: 1020 




GGTCTTTACT 


TTCCATTGTT 


ATCTCATCAT 


TATGCTCAAA 


TAAGTGCTCT 


GATAATGTTA 


. 1080 


25 


CTTTAGCATG 


GTGTGCGGTT 


TGACGATAAC 


CTAAAATCAA 


CAACTCATAG 


TCAAACGCTT 


1140 




GTTCCACCGC 


ATTTAAAATT 


TCATTACCCT 


CATTGATATC 


AAGATAAATA 


TCACATAACT 


1200 




GGTATAGTTC 


ATTTACCCTG 


TCAATATTAA 


TAGATGGGTA 


TAAATGCACA 


TTAGCATATT 


1260 


30 


GATCAAGTTG 


CATTAGCTTA 


TCAGACATCT 


CTGTAATAGC 


AGCGATGTGn AAGTTAAAAT 


1320 




CTGGTAAAGt 


TyCAACCAAT 


ACCTTGATGT TACGAat TGa TCCgAGTTAG. TTAATATTAC 


1380 




*. . AATTTCTTTA 


GTATATCTAT 


TACGACTACG ATAGTTATAT AGATATCCGC . 


CTTGTAAAAT 


1440 


35 


ACGAGATTGA 


ACCTTTGCGT 


CTGCTATATT 


GAGCATCGTT TCATATTCGT ' TTTT ATCTGG 


V 1500 




AATAATAATA 


TtACAATGTC 


GTTTCATATC 


ACCTTTACAC 


ATCAATTGCA 


TATTTCCCGG 


.1560 


40 


GACATTACCA 


TTACAGTGTT 


CTTGCCATAC 


CAAAACATCA 


CTACCTTTTG 


ATGGCAAATT 


1620 


ATATAACACT 


GAAAATGGTA 


GGG CTAGTGA 


GTTAATAACG 


AAATGATGTT 


CCGTAATTTC 


1680 




AAGTTGCTTG 


AT AAAAAATA 


ATGCGAATGC 


GAGCTTTGAA 


GGGAAAAAGT 


AAGACTTCCC 


1740 


45 


TTGCCAATCC 


AATATGACAT 


CAGATGTTAC 


AAAATTTTCA 


TAAATCACTT 


CTTTACCTTC 


1800 




TGCTGTCATA 


TATTTCTTCA 


AGATCGCTTT 


ACGATTTAAA 


TCGTAAACAG 


TTTGTGCAAA 


1860 




TTTAATACCA 


TTCTTAGAAT 


AATAATCGAC 


AAATCGGACA 


CGTTGTTGGT 


CATCAAACCA 


1920 


SO 


TTCGACACGA 


CTAACAATTC TAGGGCGCTC TCCACTTTGA yAAAATATTT TACCTCGyAG 


- 1980 




ACGTCCCATA 


TCATTaATTG 


TAG C CGAATT 


GTTGTTACCT 


TTAATTTCCC 


AAAAAGCTGG 


2040 




TACAGTAACC 


TGATTAAAAA 


ATCGTGGTTT 


CATATTTTCT 


GTATTATGAT 


TATCTGCAAA 


2100 



55 
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TAAATCTTCT TCCAACTTAC TGGCTTTAAA AGACTCATAT AACTTTCGTG AATGATCGTT 2220 

AAAGTAATCA AATAATTTAA TCATGTAGCA CCTCTTGaAC TAATGTTTCC CATTTTAAAA 2280 

5 

TAATATCTTG AGTCATAAAT TGCTGTGCCA CTTCATAAGA GATGTCATGT GGTGTCTGGG 2340 

GACCATTGTT AAAATACATT ACAATGGcAT GAGCTAGTTT TGCGATAACA TCATCCACAC 2400 

1Q TATCTTCGTC GGTATCAAAA GGTACCAAGT AGCCATTTTC CCCATCTCGA ATAAAGGTTG 2460 

GGTTACCATA ATTCACATTT AATCCAATCA TACCTAGTCC TGAGCCTACC GCTTCCATTA 2520 

GTGTTAACCC AAAACCTTCG CTAGTTGATG CAGAAAGAAA TAACTCATAA TCATTATAAA 258 0 

1S TTTCATCAAG TTTAACATGC CCTAGTAAAC GAATATAATC TTGTGCGCGG TGTGTATCAA 2640 

TAATTTTACG CAGTCGCGTC TTCTCGCTAC CTTCTCCATA AATATCAAAT GTTAATTCTG 2700 

GCACTTGTCG TTTAGCCACG ATAACCGCTT TGACAAGCCA ATGAATATGT TTCTCATTCG 2760 

20 

CTAAACGAGA TGCACTAATC ATCGCATATG GCTTTCTTGA TAATGTTGGA TATGATAATG 2620 

CATCAATGCT TCCCACAGGA ATAGTATAAA CACGTGGGCG ATAACCTTGA TATTGCTCAA 2880 

ATTGTCGACA AACCATATGA TTTTGAATAT CTGTTGCTGT AATAAAGAAA TCAATGTATT 294 0 

25 

TAGCTTTTGA AAATTGATAT TCATAATAAT TGTTCCATAG TATATGCTGC TCACTCATCA 3000 

TATTATTACT ATAATGATCA GCATGAATCA CAACACCAAC TTTACTATCA CCTTTATGCT 3060 

30 GCAAAACAGC CTGACCAATA TCAGAAGCGC GGTCTAATAT GACAATATCG TCTCGGGTTA 3120 
AATTCAATCG TTGTAAAAAG TATGCAATAA ATTCCGTTTT GTTATACAAC ACCGCATCTT > 3180 

CAAACACATA TATAGAGCTG TCTCCAfCAA TATATTCGTT ATAAGCGATG GAACCATCTT 324 0 

35 GATTATAAAA TTGTCGCATA TATAATTTCG CTTTATTATC AGCTGGTGCA TAATACTCAG 3300 

AAAATATGCG CGTATAACTA TAAAAATCTT TACGTACTAA CATACTATTA ATTACAAATT 3360 

CTGCACGATC CACAATATCT TTTTGTTCAT TTTGCAGATA ACATGTTACA AATGATGATT 3420 

40 

TCCCATTAAA ATATAGGCGG ACTATCTTAC CATTTCTTTC TCTAAAACTA ATGTCATGAC 34 80 

CAAGCTCACG TTCAATGTCA TCTAACGTGT ACGTTGTTGG TGCTAAAGAA ATATCACTAA 354 0 

4S AATACTGATA CAACCAAATA ACTTCTTGAT CTTTAAACCC AATGTTTTGC GTTAATGTCT 3 600 

GTATGTTCTC TGACTGTATA AAATCTAAAA ACACAAATTT AGTGTCTTGA TTTGTACGTC 3660 

TCAATAATTT AGCACGGTAA GCTTGTGCAT ATTCAACACC GCTACTCGCC CAGCCTATAC 3720 

50 CAAAGTTTAT ATTATATATT GTCATGCGCT ACCCCTTTTC ATTTATGGAA AATGTATAAC 3780 

TGGCATACCC TCTTTATCAA ATGTAATCAT GCTTTGACAA ATATTTTTCA CCATTCTTTT 3 840 

TTTGATATTT CGTGTCATAA CTTCAAATGA ATCTAAGGCA ACTCTATGGT ATTCAAAAAT 3 900 

SS 
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GACTTGTTCT 
ATAATAATAT 
TAATAAAAAT 
AAATTGGAAA 
TTCCTCATTT 
AGCATCATCT 
AATGCTTTTT 
aCGcTGCGCT 
TCGTTGTGCA 
CTTAACTAAA 
ACCAGAACGA 
AACAGCTAAT 
TGCCATACTA 
TTCTTTTGCA 
TTTCGAAAAG 
TTCATGAAGT 
CACTTTATCT 
TTTTGAATAC 
AAATGATTCA 
TGTTGAAACC 
AGTTCCCGGT 
AAAGTAATCG 
CACTAGGACC 
TTCAATACCT 
GTCTTCAATC 
TGGTGCACCC 
ATCAATAATA 
ATCAATTAAA 
TATATTACGT 



AACCAACATG 
GCACTTTGCA 
GTCACTACTG 
CTTAAATTTT 
ACAAACATTT 
ATTTCTAAAA 
TCAAATTCAT 
TTAACTACAA 
TCTAATGAAT 
TAATCATCTA 
CCACGTAATT 
CCACCTAATG 
GTCGCAACAG 
ACATTTTGCG 
TATTCAGCCG 
TCAACTATAT 
GGTTCATCGA 
AAATCAAAGA 
AAAAGTTTAA 
TCCATACCTT 
AACATACGAC 
ACATTAGATT 
ATCGCTTGTT 
TGATTTAACA 
AATGTATCTA 
GAAATAACTA 
CCGTAATTTA 
TAATCAAAAC 
TTTTCCCCTT 



AATCAATTGC 
TGTTTTTACG 
CTTGCTTATC 
GATAAATATA 
CAAATACATC 
CTCGATTGCG 
TAGCCATTTC 
TTTGCTTAAC 
ATAATTGATT 
GTGAAATATA 
GCCTGTCTAC 
CTTCGACACC 
TCATGGAACC 
CAATGAGTAA 
CTTCAGCAGT 
CATGAATCAT 
TACGTTGAAT 
ACT CTGATTC 
ATAAATTCTG 
CTTTCGCTTC 
CTGTAATACG 
CAAACAAATA 
CGCTATATAA 
GCCATATTTC 
CAAACTCTTT 
ATGGTGTTTG 
ATTGTGGTAA 
CGAGACGTCC 
TTTGATACTC 



TTTCAAAAAG 
ATTCAAAGCT 
TTTAAAATTA 
CTCGACAACA 
TTTAGCTAAC 
TTCCTCGTAT 
ACGAGCTTTA 
TTTGCGATTA 
ATTTTCCGCT 
TATACAAGAT 
ACGGCTATTT 
TTCACCAAGT 
AATTTGCCCT 
ATTATTAGGA 
TCTCGTTATG 
CGCGATGTTT 
CGCTTTATCA 
GCCTAATTTT 
GAAGGTAATT 
AATAGCTTGG 
GTCAATTAAA 
TTGTGCGCGC 
ATCTTCAACA 
TTTTTTGGTC 
CACAATATGA 
AGCAGCATCT 
AAATTTCCCT 
ATTAGTTGTA 
ATAATCCACA 



ACTTTTTGAA 
AATTGCTTTT 
ACACAAGCCA 
CGCGATTTTG 
GCTTTAAAAT 
ACAAGATCTC 
ACCCCTTGTT 
AACAAATTAC 
AAATTACTAT 
GATCCCGGAT 
TCCATATGTT. 
TTAATATCTG 
GCTTCAGCTA 
ATATCCATTT 
AGTAAAACCG 
TTCTCATCAA 
GTTGGTACTT 
CCTGTAGCTG 
GTTGCCATAA 
TGAAGTCCAG 
ACAATATCAC 
AGTGCTAAAT 
TTAAAGTATG 
TTCTTCATTT 
AATAGATTTG 
AAAATGATTG 
TCCGCACTAT 
TATATAATAT 
ATATCAACAA 



CGAAAATATT 
CAAATTGCTC 
CATCTTTATT 
TTAGCACCTT 
CTTGATTCTC 
GCTGTATACT 
CTTCCGAGAt 
TTTGCGATAA 
CGCTCCATCG 
CCCCTTGTCT 
CATGAATAAT 
TGCCTCGACC 
TCATCTGCGC 
GGAATAATAC 
GTCGCCCCGT 
CTGAACGAAA 
GTACGACTAT 
TCATACCTGA 
CACTTTTATC 
CTTGCAACTT 
CATTATATAC 
TAATATTACG 
ATTGTGCCGC 
TAAAATGCAC 
ATTGTAATCT 
AATCCACTTC 
CAGCCAAATT 
CATGTTCATA 
AACCTAATGA 



4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 

4500 

4560 

4620 

4680 

4740 

4800 

4860 

4920 

4 980 

5040 

5100 

5160 

5220 

5280 

5340 

5400 

5460 

5520 

5580 

5640 

5700 
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TAATCATTCG TTGTAATTAA ATATGTTCCT 
ATCGTTGCCG TTAATGTTTT ACCTTCGCCT 
5 AATACAATCG CTCCGATTAA CTGAACTTCT 

GCTTCACGTG CCACTGCATA AGCTTCAGGT 
GCTAAACGTT CTTTAAATTC TATTGTCTTT 

10 

ACTTCATCGC TCCATGTATT GaTGsGTTcA 
CGTTTATCGT AACATCTAGT TTATGTTTCA 

1S TCTAAGTAAT CTAAAAATCG TACTGGATTC 

TCTTGCTCTT CTTTAAAATA AACCTCGACA 
ACATGTTCTG TAAGCCATCC TTTTAAATCA 

20 CAACCCAAAT GCTGAGCGAC ATAAGTTGCA 

AAATTAATAG CCTTTAGGGT ATCTTGACTT 
CCCTCGATAT TGTCGTC CAT CCAACGTTCA 

25 AAATCATTCG AAATAGTTGG ATAGGTGTCA 

TCATTTCCAT ATTGGTCATC GCCTATCTTC 

TATTGATGCG TCATCTCTGT GATTGTTAAA 

30 , :t.^ 

TTCATCATTT TTATTTTATA AGCATAGGCk 

GACTTTACAA TCTCAGTACT TAGTTTTGTG 

3S TACACTGAAC CAGCAGGCGT TGCAf CAAAA 

CGCAAAATTG GkAAACTTGG CGcACTTTTA 

TCATGAATCG GTAATCCAGA GGGCATCAAA 

40 AATGATACTT TAGAGCCATA CATAAATGTA 

AATGTTTTGT TTTTCAGCAT GTTGAACTCT 

AAAATTAACA AACCAACTTG CAATGGTAGG 

45 

GCGATTCATC ACTCTTGCTT GGTGTGCTGT 

TGGATCATAA TCATCATGTT GCATATATGC 

CTTTTGAAAT GTTTGCCAAA ATTTTTGATT 

50 

ACCTTCATTA GACACCAGGA CGTCTAATGC 
CATATGTTCA GCAATCGTTC CAATATTAAC 

55 



TTTCCCGAAA GAGCATTTAA ATATAAAGGC 5820 

GTTTGCATCT CCGCAATGTT ACCTTCATGC 5880 

TTAGGATACA TACCTAATAC TCTCCAGCTC 5940 

AACAATGTAT CTAGTGTATC AACTCCTGAT 6000 

TGTTTTAACG CATCATCAGA ATATGATTTA 6060 

CTATTTTTCT AATCGACTTT AGTCTTAATT 6120 

TTTACTTCCC CACCATTCAG TTTCGATACA 6180 

ATTAAACGTG ACATATAATT TAGATGTTTG 6240 

TTTGTATCTT TTAGTTCATG ATTTCCTGGG 63 00 

TCATCTTCAT GGCTTGTACG ATACACTTTG 6360 

AAAACATTTG ACTTTGACCC ATAACTAATC 6420 

TGCAAATCAT TCTTTAGTTG CTTAATATTT 64 80 

ACGAGCCAAA CATGACCAAA CAGTTTCAAA 6540 

GATGGTTCTG CAATAATGAC ATTGATCATA 66 00 

GTCACCCGCA TGCTTTTATA CTCTAAATCA 6660 

CATCTAAATA TAAGACTCGT CGATG CTGCA 6720 

TCATCAGGAT ATTGAATCGT AATACTATTT 6780 

CCATTTTTAT TATAAAAAAT GATGATAAAA 684 0 

TCAAAATGCA ATTTATAATG CTGTCCTCTA 6900 

TATTTTGAAA ATTGCTTTAA CATCAACCAC 6960 

GGATTTATAA AAGTCACTTC ACCATTTGAA 7020 

GTTTGTGAAA TATAATTCCA AGTAACTTTA 7080 

GGCAAACTTG TCTTCGAAAA TAATGTTGTA 714 0 

TGAATCATCA TTATGTCGCC CAGGAATACT 7200 

CAATACAGGT AATAG CTCTT GAAATGCATG 7260 

TATGG CAAAA ACAGTTTGTG ACAATGATTy 7320 

TAATGCCTGT ATCGACGCTT GAGATGTATC 73 80 

TGTACCGAAC TCTTCTGGTC TAAGTAATCG 744 0 

AAGTGGTTTA CCAACAATAA TTGCCTGAGG 7500 



976 



EP 0 786 519 A2 



TAATTCATGT GATTTAAAAT TCAGCTTTTC 
TTGTTCATAT TCAGATGAAC CGATATAAAA 
5 AAGTAAAAAC GGTGCATTCA TACGTTTCAT 

TCGATAACCA CTAAAATATA CGTTTAGTGG 
AATAAATTCC TGTCGTTGAC TATCTACGAA 

10 

GTCTAATCTA GACCATCGTT TGTGTATAGG 
CTTAACAGTT ACACTTATAT AAGCATCAAA 

?5 TAACATATCA TCAGTCAATA CGATTTGTTC 

CAATCTAAAT GTATATTGCA ACTCGACCGC 
AATGACTTTA TCTTTATCGT AAACGAGATT 

20 TTTCCCAAAT TCTCCAGTCA ATGTGAGCTC 

AAAATTCGGA TGCACAAGTG CTAACTTAGG 

GCTAACTGCC TCTAATTTAT TATTACGTTC 

25 

AACGTATTTT TGGAGATTTT CGTCTTGTTC 

ATACGTATTG TATGGTTCGC TTATCATTTG 

TGCTTGAATA TAG ATAAAAT CAAAGCGCCC 

30 

TACATAACCA CTATCAAATT CAAACAATCC 
TTTGTGTTGA AAAATAGGTT CTAAATCGTC 

35 TGGCATCATT TTCACCTTCT ATTAACTCAT 

ATGCATCTAT TAATTTTAAA GAATAGGCGT 
AATAATAATT TAACGCATCA TCTAATTCAT 

40 AATCAGAGAC GTAATCTGTT TGTTGACCAT 

TAATTTGTAA ATACAAGTCA GGTTCTTTTG 
ATGCTTCTAC AACATCATGT TCAGCATGTA 

45 

CTTCAGGTGT CATTAATGCT GAAACATTAA 
CATTTACCGA CGTAATACAT TCACGAAGCC 
ATAAAATTAA ACGGTAATAA TCTTCCTGTG 

50 . 

GTTGCAAATC AGCGTCACTC ATACCATCTA 
GACTACTTAT ATTAGGTGAT TGTCTCGTTT 

55 



TAATGTCTCG TCAATAACAT TGATAATACC 7620 

ACTACCACCT TCAACACGAG GATCGCCGAT 7680 

CATATAATAT CCTTCGAAAC CTTCCGCTGT 7740 

CGGTTTCATA TCACCAGGGT GGAAATAATA 7800 

ACGACTACCA CCAAGTAAAA ATTGACCCAT 7860, 
TCCTAAATGT ACCGTCCCGT TCCCACGCGC . , 7920 , 

TGGTTTCGCA GGTATCTCTA AAGGACTGTC 7980 

AATTAATGCA CCATCAGCGC CAGTCTGAAT 8040 
ACCATCAATA TCAAATTCTG GCCATATTTG . 8100 

ATTTTGCCAA GATGCGATAG GTTTAAATTC 8160 

TGAATTACCT TGGTAAACGA CATCTGCTTT 8220 

AGAAACCTTA TCTCCATACT GTCCTGAGAA 8280 

TTCAATATTC CGGTAATGTA ATGGTTGAAG 8340 

ATATTCAACT GACCAAAATG ATTCATCAAC 8400 

TAATAAATTC GTTAATGTCT CCGAGTATGG 8460 

TTCTGCTTCA ACAATCGCTT CAATAGCCTC 8520 

AATATCGAAG TAATCCCAAC TCACACCTTT 8580 

TCCTCCAATT TGCAAAACTC TAAATTTACG 8640 

CGAGCTGATT AATAATATTC TT AG AAG CAT 8700 

ACGCATAATT CCAATTTTTC AAATAAAATA 8760 

CAACTGTATT TATAATACGG CCATTGTCAT 8820 

TAATTTGTGG AATCCCAGCG CTAATTGCAC 8880 

ACATATCTAT CACAAGTCGC AACGTCCGCA 8940 

TCGTCTTAAC AGCAATGATG TCATCTTGAT 9000 

CATCCGCATT CTGTTTAGCT TGGTATTCCT 9060 

ACATCGGTAT GTCATTTTGA TGGCGCGATA 9120 

CGATATAATC CACAAGTCGT TGCATCATTT 9180 

TCCATACACC TATAAATGTT TCCATCAATT 924 0 

CAAATGGTGT GATTCGAATC ATTGTATTCT 93 00 
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TTAAATGGGC ATTCTTTACG ATAGATTGAT ATTCCTCATC TGACACAGTT TCATTTCTAT 9420 

TTTTAAAAAA TGAATAACTT AATGATTTCG CTGGAATATG ATTGGCTATT TGTCGATTGT 9480 

GCCTAGCATC TGAAGCCACA ATCACATGAT CATCTTCATG TATTTGTTGT GCAATCATTG 9540 

CTTGAAATTT TTCTTCAATT AGTTGAGCCA TATTGTTATA TTCTGTTTGT TGATAGTGAT 9600 

GTTGATATCT TTTTGAAACA GTGACTCTGC CATTTTTCAA ATCTTCATGA AGTACACAAT 9660 

CTCCATTAAT CGTTAAATAT TCTTGGTAAG AAGCCTCTCC CTGATCATCA AAATAACGTA 9720 

TCGCTGATAA ATAACCTCTG TCATCAAAAA TATAACGCCG TTGTAACTGA TCTCTTTCAA 9780 

ATTCTTCAAA CCAAATTGAA TACCCTTCTT GACTAAAATA AATATTTGTA TAGGTCTGTT 9840 

CACTCGTCAC ACATTTTAAT AAATACGGTG TGTACACAAA CTCAACATCA TCCGGCCATT 9900 

TTAAGTGATG ATAATTAATC GCTTGTGGCG CATGGTGACT GAATCCTTGA ATTTCATCAA 9960 

ACACAGAGGA ATACTTTGTC TCATATAAGT CATATCGATG TAAAAATGTT CTTAAATTTG 10020 

GTGCATGATT GAGAACAATC AGTTGATAAT CTAAGTCATT TTCAAGGTGC ATTCCCATTA 10080 
AACTAATCAT ATCGTCAAAT TCCGTCTTAT TTTGTAGTTG ATAATACGGC ACAGTCGTGT ' 10140 

CTTGCCACGA TCGTTGGTCA TCGTACCAAG CTGGAATAAA GTATTTCATA ATTACCTCCT 10200 

TACCAATACT GGTTTAAAAA TGG CTTATAT TTATCAAAAT ATAAATATGT ACGAATTGTT 10260 

TCTGGAATAT TAATACTGAT GTAAACTAAT ACAATCAGTT GTACTGAGaA ATAAATTTCA 10320 

GTAGATAAAT GCGGTACAAA CAATGTGAAA TAAAGCGGTA TACCAATAAT GACTGTAACT 103 80 

AATGGGAATC CAAACCAACA TACGCGTCGT GCTTGATAAT TTAAATAACG TTCTGTATCC 104 40 

TTACCAGGTT TaACTCCTGA AAAATAATTG CCACTCTTTA AGAAATCTTT GGATTTTTGT 10500 

TTAGTATTGA TTAAAAATCT CGATAAAAAA TAACCCAATA ACATTTGAAT CACTAAATAT 10560 

ACTGAAATAC CTACTGGACT ATCAAATGTC AGCATTGGCA TGTCATCTGA TATGCTTTTA 10620 

TTAAACATAG ATAAAATAAA ATGAATGCCA CTTTTTAAGA AAACAAAAGC TGAAATACTC 10680 

ATCATTAAAG TAATACTGCC TGCAGGGTTA ACTTTCCAAG ATAAATAAGA TTTCATATTT 10740 

GTTGCGGAAA CGTTCATTAA ATCGATATAT GGTATTCTCA CTTCTACTAA TTCAATAAAT 10800 

AATAAGATAA ACAATGTGAT TATCACAAGG ATGATTAACA ACGCAATCAC AATATGACTT 10860 

GCATCTATAT ATTCCATTTT TTGATGCATC ATTGATTTAA TAATACTAAC CATTACAATC 10920 

GGCATTGGTC CTGCGATGCC GTAGCGACTA TTTTTGTCAG CTAACCAAAC TAATAACATC 10980 

GTTCCAGTAA CCAAAATCAA TATTGTTAAG TAAATATTGT CTTGATGAAC ACGTTCTTTC 11040 

GAAACATATT CATGAATCAC AAAATAACTT TGAATAACAC TTAAAATTAA TGTTAAGATG 11100 
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GAAATCAGCA 
TTTAAAGTAT 
TTTACTTGCA 
AAGATAAAAC 
AGTTTTAACA 
CTAATTATTA 
TAGCCAGCTA 
TTCTTTCTCT 
TTTTGTTTTA 
TTATGTTTAG 
GTTGCTTCAC 
TCTGAOGGAT 
GTTGAGTCAG 
GTCGAATCGG 
ATTGATGTTG 
ATTGATGTTG 
ATGCTTGTTG 
TCTGATGTAC 
TCTACTGTAC 
GTTGATAATG 
. ATTGATGTTG 
. TGTGACATTG 
GTTGAACCTG 
ATTGAGTCAG 
TCACTTGTAG 
TTACTTGTTG 
ATACTTTGCG 
GTGGAACCAC 
TCACTCATTG 



TCAAGATAAT 
TAACGTCTCC 
TATCGTTaTA 
ATGTGTATAG 
TGTTGCACCT 
AAATCCTATA 
TAAATTCAAT 
TCATTAAACC 
TTGAGTCACC 
TCACTTCAGA 
TTGATAAGCG 
GCATTGAGTT 
AAATGCTTTG 
ATGTGCTCAA 
AGTCGGATTT 
AGTCAGATAC 
AAGTTGAACC 
TCAATG ATTC 
TTTGTGAACC 
ATGTCGACAC 
ATATCGATGT 
AATCACTTAA 
ATATTGAGTC 
ATGTTGAAAG 
ACATTGAGTC 
AGCTTGACTG 
AGCTACTCAA 
TTAAAGATAT 
ATATTGAATC 



CATTGATGTT 
ACCCATATTA 
GGAAACGATG 
CATACGTTTA 
CTTTTATATC 
TCGATTTTTC 
TTATGCTTGA 
TAAACCAACT 
TGTATCTGGC 
TGTTGCACTT 
AGATGTGCTC 
AGATTCAGAT 
TGAACCAGAC 
TGACGTTGAT 
GTCTTGTGAC 
GCTCGTTGAA 
ACTTGTTGAG 
TGAGTCACTG 
ACTGATACTT 
CGATGTGCTT 
ACTTAAGGAA 
TGATGTAGAT 
ACTTAAACTT 
TGATGTACTC 
GCTTTCTGAT 
CGAATCGCTC 
TGATTTTGAA 
•TGATCCACTT 
ACTTAG CG AG 



AACCACGGAC 
GAAATAGCTA 
GAAATGTTTG 
TATATAATTT 
AAAAACATTA 
TAGTGATTGG 
GAATCATCTT 
AATAATGTCA 
AATCTTTTTT 
AATGTAGACT 
GTGCTGTGAG * 
GTACTTGTTG 
ATAGATGTAC 
GTGCTTGTTG 
ATTGAAACAC 
CCTGAACGAG 
TCCGATGTAC 
ATAGAAGTTG 
ATTGAAGT AG 
TGTGATGACG 
CCAGATGCAC 
GTGCTTGTTG 
GTCGATGTTG 
GTTGAATTTG 
GCACTGATGC 
ACACTTGTTG 
TCACTTAATG 
AATGAGTCGG 
GTAGACTyGc 



CTAAtCCTAA 
TTTTAAAAAA 
TGCCTAATAT 
TATATTCGTA 
AAAAGACTAA 
TGCCTCAGTC 
GATCATTTTC 
TAACGCCACC 
CACTTTGTGC 
GAGATTGACT 
TATGATGCAT 
AGCCGGACAT 
TCAGTGATTC 
ACACTGATTC 
TCGATGAATT 
ACGTACTTAA 
TTGTCGATGT 
AATCACTTGT 
AATCACTGAT 
ATGTACTAGC 
TTGTACTTGT 
, AGCTCGAGTC 
AAACTGAtwC 
ATCCACTGAT 
TCATAGAGTC 
ACGTTGATTC 
AATCCGAAGT 
AGTCACTTGT 
tTACGCTTTC 



AGTGAAAATG . 

TGACTCATGT 

ATAAATAaAC 

TTGTTGTAAA 

GGGTTCATCA 

TTTTTAATTT 

ATCTTTCTTT 

TAGTAATCCA 

TGGTGTGCCA 

CGTGCTCGTT 

ACTCATTGAG 

ACTTGTTGAT 

GGATGTGCTT . 

TGAGTCACTA 

AGATTCACTC 

TGATTCAGAT 

CGAGTCTGAA . 

AGATTCTGAT 

ACTGTCTGAT 

ACTCATTGAC 

TGACTGGCTT 

ACTTACACTT 

GCTTCCGCTC 

GCTAGACGAA 

AAATTGACTA 

TGATCCACTC 

GCTAAGACTT 

ACTAGTAGAA 

TGAACCACTT 



11220 
11280 
11340 
11400 
11460 
11520 
11580 
11640 
11700 
11760 
11820 
11880 
11940 
12000 
.12060 
12120 
12180 
12240 
. 12300 
12360 
12420 
12480 
12540 
12600 
12660 
12720 
12780 
12840 
12900 
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TTTGAATCAC TTAATGAATC AGATTCACTC ACGCTTTCTG AACTTCTTAG TGACGTCGAT 13020 
ACACTTAATG ATGACGAATC GCTTGTGCTT ACTGAATCG 13059 
5 (2) INFORMATION FOR SEQ ID NO: 221: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10758 base pairs 

(B) TYPE: nucleic acid 

10 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



15 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 221: 

AGGGATGGCC TTACCTAAAA AACCGGGnAA ACCCTCCAAA ACCCATTAAA AGGnTGGnTA €0 

CCCTTTAAAA TGGTAGCATT TAACCGCCAC CCGCCAAGGT GGGTGGTTTA TTCTTCCGTT 120 

20 ATTTAAATTA GTACACCATG CAGATTCTGT AGTTGAGGGA TATTTTAACG AAAGCTTATT 180 

AGCAACTGAT AAAAAAATAC GTCCTAAGGC AT AT ATTG CT TCATGGAAGG ACATCGAGCC 24 0 

GGCTAAGAAA ATAGAATTTA AAATTAAAAA AGGTATTAAA TGGCATGATG GTAATGAATT 300 

GAAAATTGAT GATTGGATTT ATTCAATTGA AGTCTTAGCT AACAAGGACT ACGAAGGTGC 360 

TTATTATCCA AGTGTAGAAA ATATCCAAGG TGCGAAAGAT TATCATGAAG GAAAAACTGA 420 

TCATATTAGC GGATTGAAGA AAATAGATGA CTACACTATG CAGGTTACAT TTGATAAAAA 4 80 

ACAAGAAAAT TACTTAACAG GATTTATTAC TGGACCTTTA TTAAGTAAAA AATATTTATC 540 

AGATGTACCA ATTAAAGATT TAGCGAAATC AGATAAAATC. CGAAAATATC CTATTGGTAT 600 

TGGACCGTAT AAAGTTAAGA AAATCGTTCC AGGTGAGGCT GTTCAACTCG TTAAATTTGA 660 

TGATTATTGG CAAGGTAAGC CTGCACTAGA CAAAATCAAT TTAAAAGTTA TTGATCAAGC 720 

GCAAATTATT AAGGCAATGG AAAAAGGCGA TATTGATGTT GCGAATGATG CTACCGGTGC 780 

40 AATGGCAAAA GATGCTAAGT CATCTAATGC TGGTCTCAAG GTATTATCTG CGCCAAGCTT 840 

AGACTACGGT TTAATAGGtT CGTATCTCAT GATTACGATA AAAAAGCTAA TAAAACTGGT 900 

AAAGTGAGAC CAAAATATGA AGACAAAGAA TTACGTAAAG CAATGCTTTA TGCAATTGAT 960 

45 

AGAGAAaAAT GGATCAAAGC GTTTTTCAAT GGTTACGCTA GTGAAATCaA TAGTTTTGTA 1020 

CCATCTATGC ATTGGATAGC AGCCAATCCT AAGGACCTAA ATGATTACAA ATATGATCCT 1080 

GAAAAAGCTA AAAAAATCTT AGATAAGTTA GGTTATAAAG ATAGAGATGG TGACGGATTT 1140 

50 

AGAGAAGATC CTAAAGGTAA TAAATTTGAG ATTAACTTTA AACATAATTC AGGTTCTAAT 1200 

CCTACTTTTG AACCAAGAAC TGCTGCGATA AAAGATTTCT GGGAAAAAGT TGGCTTGAAA 1260 
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AATACGATTC CTGTTTATAT GCCATATATC ACATCTTATT TCATGACGCG TGCTATCGGC 1380 

GACAGACCTT TAGTCGTCCC GCATCAATCT CAGAACTTAG CATTTATTQG TAACTTTGCA 1440 

5 GAAACAGAGC GAGACACTGT ATTTACAACA GAATATTCGG TTOGTACTGC CATGGAAGCT 1500 

GTTTATCAAT TACTAAATAT AGATCGTGGT ATTCCAGAAG TCATCAATAG TCCATTTGAT 1560 

CTTCGCGTCT TAATGGATGC CATATACGAA CTGAATGACC ACCAAGATTT GCGTGAGATT 1620 

10 

ACTAAAGATT CGAAAATGCA AAAACTCGCA TTAGCAGGAT TCCTTAAAAA GATAAAAGGT 1680 

ACGTACATTG AGTCATTATT AAAAGAACAC AAATTGTTAT AACGAAAACC ATTAATAGAT 1740 

TTTTATTTGG TGATTTCAAA TCATGAGACT GGGACAGAAA TGATGTTTTC ATAAAAATTA 1800 

15 

TTTCGTTGTT CCACTCTCAT GATTTTTTTG ATGAAACATA ATTACATGAT TGATTGCATC 1860 

ATTTTGTTAA ACAAGTGATT GCAAACCTGC CATTTCACAC TGAAAATTTA CATAATAAGT 1920 

20 GACGATATTT TACAAGTCAT ATACAAATAA CATATATTGT TAAATAATTT TACCTAATCT 1980 

TAACATTAAA TTTACAATTA TAAGCGATAA TCTAAATATA AAGCTTATTT GAGGTGAAAT 2040 

AATGGAAATG TCGGTTACAG AAGTCATTTT CTCCTTTTTA GGTGGTTTAG GTATTTTCCT 2100 

25 TTACGGCTTA AAAATCATGG GAGACGGGCT TCAAGCATCA GCAGGAGACA GGCTACGAGA . 2160 

TATTTTAAAC AAATTTACAT CAAATCCAGT ATTAGGTGTT ATTGCAGGTA TCGTTGTAAC , 2220 

TATTTTAATA CAAAGTAGTT CAGGTACGAC AGTTATCACA ATCGGACTGG TAACAGCTGG 2280 

30 

ATTTATGACA TTGAAACAAG CCATTGGAGT GATAATGGGT GGTAATATCG GAACAACGGT 2340 

AACTGCATTT ATTATCGGTA TAGATTTAGG CGAATATGCA ATGCCAATTT TAGCATTAGG 2400 

TGCATTCTTA ATCTTTTTCT TTAAACGCTC TAAAATCAAT AACATTGGCG GCATACTATT 2460 

35 

CGGTTTCGGT TCACTATTCT TCGGTCTAGA ATTTATGGGT GATGCCX3TTA AACCTTTAGC 2520 

ATCATTAGAT GGATTTAAGC AATTAATGCT TGATATGTCT ACAAATCCAA TACTCGCTGT 2580 

40 CATTGTCGGC GCAGGGTTAA CAGCACTAGT TCAAAGTTCA AGTGCGACGA TTGGTATTTT 2640 

ACAAGAATTT TATCAACAAG ATTTAATTAG CTTAAACGCA GCAATCCCTG TGTTACTAGG 2700 

CGATAACATT GGTACCAGGA TTACAGCTAT CTTAGCTAGT TTAGCCGGCT CAATCGCTGC 2760 

45 AAAACGTGCG GCGCTTGTAC ACGTCATGTT TAACTTAATC GGGGTAATTA TCTTCACAAT 2820 

TTTCTTGCCA GTTGTGATTC ATTTGATTAG TTTGTTACAA GATTTATGGC ACTTAAAACC 28 80 

AGCGATGACG ATTGCAGTAT CACATGGTAT CTTCAACATA ACAAATACTT TGATTCAATT 2940 

SO 

ACCATTTGTA GCAGGTTTAG CATGGATTGT TACAAAGCTT GTCCCAGGTA AAGATATTGC 3000 

TGATGACTAT AAACCTCAGC ACTTAAACAA AGATCTTGTT TATCACGCAC CTGGTGTTGC 3060 
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AGACATTCGC GAAATTACAA AAGACGATAA AAAATTGATC AAAAAGCTTG AACAAAAGCA 3180 

TCAAGCTGTT GAAACAATCA ATGATAGCAT TCGAAATTAT TTAGTTAGAA TTTCTACAAA 3240 

AGCCATTACG AAGGCAGACG TTGAGCGTTT AGCAGTTATG TTTGATGTCA ATCGCTCTAT 3300 

TTTAAAAGTA GCAGAGCTAA CAGAAGAGTA TGTCGCTCAA TTAAAACGCC AACATGATGA 3360 

AG ATATTCG C ATTACAGAAG ATGCACAACG CGGTATGGAT AAATTATTCA ACCATGTTGC 3420 

TGAGTCATTT GATAAAGCCA TCGACATGTT AGATGTTTAT GACAAAACGA AAAAAGATGA 34 80 

AATTGTAGAA CGTAGTAGAG AATCATTTAA TATTGAACAT AAACTACGCA AAGGTCATAT 3540 

TAAACGCCTT AATCGTGGTG AATGTACAAC AAAAGGCGGA TTACTATATA TCGATATGAT 3600 

TGGTGTTCTT GAACGTATCG GTTATCATTC ACGAAATGTT TCTGAAGCAC TTGTTGGCCT 3660 

TAACGATGAT GTACCTACAG ATGAAGAAAT TGCAACAAGT GAAATTTAAT TTTTACTGTC 3720 

TTATTTATAT TCATATTTTT TTAAAATTAG AGATTCAGAT GCATGTAAAA AGCCAATCCA 3780 

ACATTCATGG GTTGGCTTTT TTGTTTAGCA AAATTTATTA TCTTAAATCG GCTATAAACA 3840 

CTGATATAAT AATGCTTCAT TAGTATGCGG TAAGCATGAC GGACACTGTT CTCGGAGTCT 3 900 

GACCCCGAAA CGTTTAATAT ACACTTTTAC ACGTCGCCTT CATTGAAGCG AATTGCCATA 3 960 

ACCTTCACAT TATATATAGT TCTTTCCATA TAAATGTCCA AATTTTTAGA ACAACGCAAT 4 020 

AAATAACCAT CCACCTAACT TATCAAAAAT TTAAGTGGAT GGTTTTTCAT TTTCATTTAT 4 080 

ATTTATATTA GTGTTAATCC AATCATAGAT TTATCTATAT GCACTGCTCT ATACATTTCC 414 0 

TCATTTAATT TGCTTTACTT TCATTTATAT CATTATCAAA ACACTTGGCG TGTCATCGTT 4200 

ATTATTTCGC ATCTTTGACA CGTTTATCAT CATTAGGAAT CGCGAATAAA ATTGCX3ATAA 426 0 

ATGCCATGAT TCCCATTAAT ACGTTAACCC AAAGTGCAAT CATCGCACCT GTATGAATGC 4320 

TCGTTGCAGC AACTGCACCA GCATATACAG CACCACTAAT TGCGACACCG AATGCGCCAC 43 80 

40 CAAGTGATGA AGCCATTTTA TAAATACCTG AAGCAACGCC AACTTTATGT AACGGTGCAT 444 0 

TCGAAATAGC TGTATCTGTA GAAGGTGTTG CATAAATACC TAAGCCTAGT CCGAAACATA 4500 

AATATCCTAC GACACAAGTG ATAACATAAA ATATGCCTGG TAAGAATACT AATGAAATAA 4560 

45 GTGCAATACC AATGACCACA ATGAATGTAC CTAATAACAT TGGTCGCTTA GAACCCATTT 4620 

TTTGTAATAA TTTTTCACCA ACTCGAATCA TCAATAACAC CATGATTAAA TAAGTAATTG 4680 

ATAAGTATCC TGCCTGCAAT GCTGTATAAC CTAAACCTTG TTGCACGAAT 1 GTATTCGCTA 4740 

CAATTAATGT ACCTGCAAAA CCGTTTAATA AGAAGTTCGA AATCGTTGCA CCTGTATATG 4800 

GTTTATTTTC AAATAATTTA AAATCAATAA GTGGATTATC TACTTTTTTC TCAACATTTA 4 860 
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4k Jk ^^^^ Jk 4fc /iill/^ 

AACCAAGTGC 


TGCACCTTTA 


GTAATGACAA 


CGlTlAAAL 1 




a r*r act AG AA 


dqon 




CAATTAGCCC 


TGCAACGTCA 


AATTTATGTG 


TATTGGTAAT 


TTCTGATTTC 


\J XXX LflUVJ^VJ 


3UtU 


5 


TCCCTTTGAT 


GAGTAACATT 


GAAAGTACGG 


CAACGATAAT 


TGAGAAGATG 


A a AATCCATC 


S100 




TCCAACCCAT 


AGTTGTCGCA 


ACTGCACCAC 


CGAAGAGTGA 


ACAGATACCA 




fin 


10 


AAGAACCGAT 


AGACCAATAA 


CTTAAGGCAC 


GCTGACGTTC 


AGCACCCTGA 


X/vLX/vVJX. X X 




TCATAATGGC 


CAATGTAGAA GGCATAATAC ACGCTGCTGA TACACCTTGT 




coon 




CTAAAATTAA 


TAATuWv.uu x 


AAATTCGTAA 


TAATAATTAA TGCTGAACCA 


AliinlnUl in 




15 


ATAATAAACC 


GATATTCGTC 


ATTTTCACGC 


GCCCAATTTT 


ATCTGCCAGA 


(JLIALA- loL X lw 






CAACAACAAA 


CATGCCTGAA 


AATAGTGCAG 


TTAGACTGAC 


CGCAATACTA 


ATTCj TLLL LA 


C A C A 
340U . 




TGTCTGTACC 


AAAACTTTGT 


TGTAAATTCG 


GTACAACATT 


TACAAGTGAT 


TGTGCAAACA 




20 


ACCAAAATGT 


AATAACACCT 


AATACAATAC 


CTAAGATTAA 


CTTGTTGCCC 


CCGCGATACG 


5580 




TTTCATTCAT 


GTTAGTTATC 


TCCTTTAAGG TAATCTAAAA 


CAACTGTCCC 


TACTGCTTCT 


5640 




GCAGAAATAA 


GTAATGATTT 


TTCTGAAATG TTAAATTTAG 


GATGATGATG 


TGGGTAAATT 


5700 


25 


TCACCATTTT 


CCACCGCTGC 


ACCTGTATAA 


ATAAAGGCAC 


TTGGGCGTTC 


TTT AG CATAA 


5760 




TATGCAAAGT 


CTTCTGAAGG 


TGGTTGTGGT 


TCACACATTT 


CAACACCAAA 


ATCAAGGTTT 


5820 


30 


GCTTCTTTCA 




CACGTACTCA 


GTAAACTCTG 


GATCATTATA 


TAATGCTGGA 


58 80 


TAATCATCGT 


X i-V 1 r\ X X^- inft 


GGTGCAAGTt 


ACACCATACA 


TATCCTCTAA 


TCCTTTTGAT 


594 0 




AAACGTTTAA 




AATTGTTGCT 


TTTGTAGCAT CTGTTAATCC 


ACGTACATCA 


. bUUU 


35 


CCTTCAATTT 


CAACAACATC 


TTTAATGACA 


TTGAATTGAC 


CTTTACCGTC 


-» t\ j\ rp/^ 7v Tv r^r*fi 
AAATGAACCAa , 


c a a n 




ATTGTGACAA 


CACCGGTTTC 


AAATGGACTT 


AGTCGTCTAG 


ATACAACTGT 


TTGTAACGCT 


ci on 
© X^VJ 




GTGACGAAGT 


AGCTACCTGC 


AACAATGGCA 


TCATTGGCCA 


TATGTGGTGA 




6180 


40 


CCACCTTTAC 


CTTGAACTTT 


CAATTTGAAG 


AATGGGCGTC 


CTGTTTGAAC 




6240 




CTGTAATACA 


CTTTACCTGT 


TTTCATTGTG 


CTCATGACGT 


GTACACCTAA 


T & P ATfi ATP A 


6300 




ACACCGTCTA 


ATACACCATT 


TTCAATCATT 


GTTTTAGCAC 


CACCTGGTGG 


f"p 7\ / «|<ii>f ^ i •* 1 '(~* R 
X Mw 11^11 


6360 


45 


GCTGGTTGAT 


GTATCACAAC 


GACTTTTCCT 


GTAAAACTAT 


CTTTCATTTC 


AGCAAGCGTC 


6420 




TCTGCTAATA 


CAAGCATGTA 


TGCTGTATGT 


GCATCGTGAC 


CACATGCGTG 


CATAACACCT 


6480 


50 


TTATTTTGTG 


ATGCAAAAGA 


TAATCCTGTA 


TCTTCAGTAA 


TGGGTAATGC 


GTCAAAGTCT 


6540 


GCACGGATTG 


CTAATGTTTT 


ACCAGGTTTC 


CCTGAATCAA 


TCGTTACTTT 


AATTCCACGT 


6600 




GGTCCGACAT 


TCGTTTCTAC 


TTCCACATCT 


TTACCTTTGT 


AAAATTCAGC 


GATGTATTTC 


6660 
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ATCATTTTGC CTTCTTTAGA TTTTAAAGTT TCAATTAATT GTTGATTCAT ATCCTTCATC 6780 

TCCTTAGTTA CATCATAAAT GATTAATCAT TATTTATATT GCCAACAACA GAGATGTTAA 684 0 

5 CCATTAATTT TTTGCAATTT TAGCTTTGAA TATAAAAAAT CACAAATTAT GTATATCAAA 6900 

ATTTGTGATT TGTGATCATT TTATGAACTT GGGTAACGTT TTACTTCAAT TAAGTGAATC 6960 

CCATTCGTAA TCATTTTAAT GTTTAATGCC AGTGTGTCCG TGATATCTAT ATCATATACT 7020 

10 

TCTAATTTCG GAAAACTCAT TCGATTAACG TAATCTATAG AGTCCTTGTC CATGCCATGT 7080 

ATCGTATGAT GTTTGCGCCA AAGATTAAAT AACGCACCAT TTTCTTTATC TAAGGTAAAA 7140 

1S TGTTTAATCT TATACATACC TTCTTCCAGG GCATTAATGT TCAAATGAAT CATTTCCGTC 7200 

GCACGCATAT TCATTTGATT GTCCAACGCT AAGTACGGAT TAAAATGCTT TGCATCATAT 7260 

AACAATATTT GAAAATTTGA ATCAGTCCCC GTGACAATAC ATGTATCATC AGAATACAAA 7320 

20 ATATTGCTTG TTAATTTATT AAATAGCAAT GCCGTGAAAT AGACCGGACG TTTTCCATTA 7380 

TATTGATGAA ATAGTTCAAT AGAATTCATA TAATCCCGTT CATTTTTACA ATGACTGACG 7440 

TGCAAATCAT AATTCAACCA ATACCCGATA CCCTCTACTT TAGAACTTAA TTTTAATAAT 7500 

25 , 

TGCTCAATGA TGATACCACC TCTAAAATAT TCGCCGTTTG TAATAAATGT ATCACCCGTC 7560 

AATGTATTCC AATTGAGTAA AATGAGTGGA CGCTTTAGGC GATGACGATG CATTAAGTCG 7620 

AtAAGGTAAT TCGTTTTATT AATAATCATT TGACTCGCGG TTTTAAATTC ATCATGATTC 7680 

30 

ATTTTATTAA AATCAACAGC GTCATTTGAA TTGGCATCAA ATACAAAATG GTCGATGTGT 774 0 

GGCTGAAGTC GTTTCAATAA TGGTAGATGT CTTTCCGTAG CTTGATCTAA GTGAATGTAC 7800 

35 AAGCCACCAT TAGGGAATAA TGCTTTAAAA TAATCAATCA TTTCAATCAA AGACGTGTGC 7860 

AATGT03TCA CATACAAGTT GAACTTCAAA TCTTTTCTAT GACTGACATG CAGGGCAACG 7920 

TGATGGATAA AAATTTTAAA TGGATGGATA TAATCACGTG AGTCATACTG ATCCAAATGC 7980 

40 ATGGTCAAAC TAAAGTTATG ATCTAATAAA AAGTCTAAAC ACAAATCAAT ATCATAAAAT 8040 

ATATTCGAAA TTTCTGCATC ATACGTGAAT GGCG CATTGA GCTTTTTCAT GATATATGGA 8100 

ATCACATCAT ATGCTAATAC TTCATTGACT TGAAAATCAT GATGACATGT AAGCAACTGT 8160 

45 

GATTGATACT GTGTATTGAG CAAATTCCTC AAATAGCCCA CTTGAATAAT ATGATTAAAT 8220 

TGATTTAGTT GGTGATTGGT TGGTTGAAAG GCAATCTCTT TATAGTTCAT CTTTTCAATA 8280 

TCTTCAATAA AATGATTCAT TTCTTCAATG TAGTCATTTA AAAGTAATAT CAATTCACGG 8340 

SO 

TCGTGATAAT CATGTTGTGC CGATTGCTGG TTTTCAGTGA TTGCTGGACG ATCACCTCGA 8400 

TATTGTTTAG GTGTTTGATG CGTAAAGTGT TTAAATGTTC TCGCAAAGCT CGCTGCACTT 8460 
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TTCGCATGCT CAATTCGCGT CGTATTTAAG 
GTAAACTTTT TAGACAGATG GCTCTCTGAC 
* CTTAAATCTT CATGAAAATG TAACTCGATA 

TTTAAGATAC TTTGGTTCGA ATGATATGTA 
AACTGAATCA CAAGTTGTTG CTCAGTCAAT 

10 

GAAACCAGTC TTGCCATTAT ATTTCTCAGT 
GTTAAGTGAA AATATAGACA ATGCACATCA 

15 AATTGGATAT AACATATGAT GCCATCTTGT 
TTAATGATGA AAATGTCGCC ACTGTTGCAT 
GCCTCnCCTT TAATAACAAA ACCAATCATT 

20 CTCTCAGTTT CTACTCGAAT TAAATAATCA 
TGAATACGTT TATTTTACAT TATTTTACAG 
TGTGTGGATG ATTATTTATC CTCACTCGGT 

25 

TTTTCACCTT TTTTCTCCAC AAAAGTAAAT 
TTTAAGTCTC CCgAACCTTT CaACaATAAC 
CTTTTTCGTA ATTGTTTTAC ATTATAGTCA 

30 

CTCGGTACCT CTGGATTATA TGATATATCG 
CTGCCATATT GCGCGAAGAA CTTAAAATTC 

3S ATACCTTTAG TTGGAATGAT TTTATTGTCT 
CTCTTAGGTC TACCATCTTC ATCATGAAGT 
GTCTTAGTGT TTCTATTCAT ATATAGAACC 

40 GGTTGAACAA CCATTTCAGA ACCAATAATC 
TCATCACGAT AACCTTCTTT ATCGTATAAA 
AATGTTTTTT CAAAGCTTTT CTTAACTTCC 

45 

AAACTAATGA CTAATATCAA AAAACTAATA 
ATTTCACAAT CCTATTCTTC TTATTATCTT 
CATGATTATT TATCCTCACT TGGTTTAAAA 

50 

TCTTTTTTCT CTACAAACGT AAATTCAATG 
TTCCCTGTAC CyTTCAACAA CArCTTCGGy 

55 



AAATGATGGA ATCCTACACC TAGCGATTCT 8580 

CACCCAACGT ATTCGCTTAA TTCTGAAAGG 8640 

TAGTCGCATA CTTGATTCAC TTTATCATCA 8700 

CGCGGGACAT AATGAATCAT ATG CATAAGC 8760 

TTAGACAACr CATTATGTCG GATATGTGTT 8820 

TGATGTATAT TCTTTGTTGT GGTCGCATCT ; 888 0 

TCAAACTTGT CTGCTAAATA TTTCATTTGG . 8940 

TGAAGTTGAA ATCGATACAA GTCGCGGTGG 9000 

TGCGTCATAT TATTTTCATC ATAAATGTGT 9060 

AAACTATTGA GCCTTTTGAA ATCTGACATA 9120 

CGTTGCATAC TATCCCTCAA TTCAGTAATA 9180 

CAACATATTT GAATTTCATA TTGAATCGTG 9240 

TCAAGATGTA GACTATCAGT AAAAAAAGTA .9300 

TCAATGTCTT TATATCCAAC TGrTGaACCT 9360 

TTTGGTGCTT TATTCGTTGG TATTTTATAT 9420 

TCATTAGTTA ATTGATATTT TGCTGAATAA '9480 

CCGTCTTTGT ACTTCGACAA ATCTTTAAAG 9540 

TCGATTTCTT TTTTTATATT TTCGTCTTTG 1 9600 

ACCATTTTAA CGGGATATTC TTTATCTTTA 9660 

GTTTCACTCA CTATATACTT CCCGGTTGTA 9720 

ATACCTTTTG ATTTCATACG TTCCCCTTTA 9780 

CATGTACCTT TATCATTTTT ATCAAATTCG 9840 

TCCTCTAGAT TTTTAATCGG ATACATACTC 9900 

GCTTCTTTAC CTATGCCACA ACCAGCAGTG 9960 

TACAATACCA ATTTGTTTAA TCGTTTCATA 10020 

TCCTGGATTG ATTTCATATT TTGATCGAGT 100 BO 

ATTAACCCAT CACTAAAGTA AATGTTCTCT 10140 

TCTTTATATC CAACTGATGA ACCTTTTAAA 102 00 

GCTTTATTTG TTGGTATGTC ATATCTTTTA 10260 
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ACCTCTGGAT TATATGATAT ATCTCCATCT TTATAATTCA TTAAATCTTT AAAATTGCTA 10380 

TATTGCGCAA AAAACTTAAA GTTTTCGATT TCTTTTTTTA TGTtTTCTTC TTTAACTTCC 10440 

TCAGTAGAAA TGAATTTATT ATTAATCATT TTAACTGGAT ATTTTTTTTG ATTATCCTGA 10500 

GCTACTTCGT ATTTCTCCGT CTTTAtTTCA TTAGTATAGT AAAAtCCTTT TGCACTTCTT 10560 

GTATTTCTAT CTATCTTCAA AAGCATGCCT TTTATTTTTA GAGCTTCTCC TTTATTTTGA 10620 

ATTGCCATTT GAGAATTTAC AATCCATGTT CCCTTATCAT TTTTATCAAA TTGATCATCA 10680 

CGATATCCTT CTTTATCGTA TAAATCCTCT AGATTTTTAA TCGGATACAT ACTCAATGTT 10740 

TTTTCAAAAC TTTTCTTT 10758 
(2) INFORMATION FOR SEQ ID NO: 222: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 1109 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



25 
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* (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 222: 

nTaTCaACTT TGGaATTTAA AgTCAATAAC TTTTTTAAAA ACTTTTTGTG TTCACAACCC 60 

GCTTCTTTTT CAACGCGTTT ATTGCTTAAC ACAAGAACTT ATTTTACCAG CATTCCAAAA 120 

CAAATCAACA TAAAAACGTA CAAAATAAAA GTAATTTTGT ACGTTTAGCA TATATTATAC 180 

CTATTTATTT GTAGCAGCTA TAACTTTTTG TGCAATCGAG CTATAAATTT TACCTAGACG 24 0 

ATCATCTGAT TGATATATTG ACGGTGCAAA ATCTTTTGGA TTCCAAGATG GTTGCTCTAA 3 00 

AGGTAATTCC CCAAGTAATT GAGTATTAAG TTCATCAGCT AACTTAGTAC CGCCACCTTT 360 
GCCAAAGACA TATTCTTTAT TACCCGTCTC TTTACTTTCA AAATAACTCA TGTTTTCAAT ' 420 

TACGCCAAGA ATAGAATGAT CCGTATGTTT TGCCATCGCA CCTGCGCGAg CTGCAACAAA 4 80' 

TGCTGCTGTA GGATGAGGTG TCGTTACAAT AATTTC CTTA CTTGAAGGTA ACATCGTATG 54 0 

AACATCTAAA GCTACATCTC CTGTTCCAGG TGGAAGATCG AGTATTAAAT ATTCAATGTC 600 

TCCCCATTTA ACTTCTGTAA AGAAATTCGT CAACATTTTA CCTAACATTG GCCCTCTCCA 660 

TATAACTGGC GCATTTTCTT CCACAAAAAA GGCCATTGAT ATAACTTTAA CGCCATGACG 72 0 

TTCAACTGGA ATTACTTCCT TCCCTTTAAT TCCAGGCTTT TCATCAATAC CCATCATATC 780 

TGGTACACTA AATCCATATA TATCGGCATC TACTAATCCG ACTTTTTTCC CTTCACGAGC 840 

TAAGGCAACG GCTAAATTTA CTGCAACAGT AGATTTACCG ACACCACCTT TACCGGAGGC 900 
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ATTTTCTTCT TTTGGTTTAA ATTGATTTAC TTTTTCTTCC GGCAATCTTT CAAATCGTAT 1020 
ACCGACCGTT TTCGCACCGT TTTCTTTTAA TGCATTAACA ACAGCCATCT GTAAATCTAA 1080 
aTTGCGtGCA CCACCTAATT GTGCCATTG 
(2) INFORMATION FOR SEQ ID NO: 223: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3997 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 223: 

TCTTTATTTA AAAAAATGAT TGTCTAGTTT GTATCTCTCT GAAGATTTGG CAATAAATAA 60 

20 AAGCCGATAA CCGTATAATG ATTATCGACT TAAAGTTTAT GTGGCATTTT TTACTTTTGT 120 

AATTTCAGGT GAGTTAGATG ATTATTATCA GATAGATTAT TGCTTATAAT CATATGATGT 18? 

TTGAATGATA TCTTTGATTT CACTGATTAG TGCTTCTTTA GGATTAGCAG TTGTACATTG 240 

25 ATCTTCAAAT GCGAGCTCTG CCATTCTATC AATTGACTCA . TTTAATTCTT CTTCAGACAC 3 00 

. ACCTTGTGAT TTCAAATTCA TTTCAATTCC GACTGATTGA CCTAATTCGT AGACAGCTTT 360 

AgCTAATGAT TCTACGAGTG CTTCTGTCGT ATTACCTTTT AATCCTAAGA ATTTGGCAAT 420 

30 ATCTGCATAA TCTGTATCTG CTCTGAAGAA CTCATATTTA. GGGAATAATG CATGTTTTTG 480 

CGGGTCTTTG GCATTATAAC GGATAATATG CGGTAGTAAT ATCGCATTCG ..CTCTACCATG , 540 

CGGAATACCA TATTCGCCAC CAATTTTATG CGCAATTGAG TGTGCAATGC CTAAGAATGC 600 

ATTTGCAAAT GCCATACCAG CCAAAGTTGA TGCGTTATGC ATTTTCTCTC TTGAAACTTT .660 

ATCACCCTTT TCAACAGATG ATTTTAAATA TTCGAACGTC AATTTAATCG CTTGTAGACT 720 
CAAACCTCTT "GTGTAGTCTG AAGCCATTAC AGATACATAT GATTCCATTG CATGCGTTAG . 780 

TACATCCATT CCTGTATCTG CTGTAACGCT TTTTGGCACA CTCATCACAA ATTGAGGGTC 840 

AATAATTGCA ACGTCAGGTG TTAAAGCAAA ATCAGCCAAC GGATATTTTA CATTTGTTTC 900 

45 ACTATCTGTG ATAACTGCAA ATGGTGTTAC TTCTGAACCT GTACCTGATG TCGTAGGGAT 960 

ACAAATGAAC GTCGCATTTT CAGGCATGCC TATTTTATAA GTACGTTTAC CGATGTCTAG 1020 

GAACTTTTGT TTAGCACCGA AGAATGATGT CTCAGGGTGT TCAAAGAACA TCCACATTGC 1080 
TTTTGCAGCA TCCATCGCTG AACCACCACC AAGTGCAATG ATTGTATCCG GTTGGAAATC 
AACCATCATT TCCAGACCTT TATATACTGT ATTAGTTGAT GGGTTCGGTT CGACTTCGCT 
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CCAATAATCC CTACTGTCTT 
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40 
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GCTAGCACCA 
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2640 




TCTTCTTGTG 


ACTTTTTAGA 


X nnl vJV- A A v_ x 


AATGCTT*I"rT 

^\*V X VJV_» A A A A J- 


TCCCTTTGTC 


AGCTAGAGCA 


2700 


45 


TCAATCATAA 


TTGCCACTTC 


TTGTTCTTTC 


GATCCACGAT 


TTTCTTTTTC 


AGGTATAGTT 


2760 




AACATATACA 


ACCACTCCTT 


TATACTTTGT 


GAATTATTTC 


ACAAACATTA 


TAGTACATGT 


2820 


50 


CTCTCAGGAT 


ATAAAGAAAA 


TTCTATACAA 


AAAAGTTTAA 


TTTCGAATAT 


TATTTGAACA 


2880 


AATATCAAAT 


TTTAAAATAA 


ATGTTTTCAT 


GAAATCATTG 


TTATTTCGGT 


GTTTTTAGAA 


2940 




TGATTTTATA 


ATCATAATTT 


TTTCAATGAC 


ATAATTTATT 


CATAATTATA 


TATTTAATTC 


3000 
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TCCTTGTCGA TACCTATCAA CAGATGTTAC AAATAAAAAC CaCCCGTGTG AACGGGTGGT 3120 

TTGTTCTGCG gCTATAAGCC TTCCTTACTG GCCaGCCCTA AAAGGGCACT GACAAGTCAG 3180 

CCAACTGCAC TACTATTCCA GCAATCCTAA AGGTTTACTC TTTTTTCTTT GTTTTTTTAT 3240 

TTTTCTCTCC AGTGAAAGGA TCTAAATATT CTTCCATTGA AATTTCATCT GCAACGATAT 3300 

CCTCTTGTAA TTGATTACGA ATATAATTTT CAATCACTTT TTTATTTCTA CCTACTGTAT 3360 

CCACATAAAA TCCTTTACAC CAAAACTTTC TATTTCCATA TCTATACTTT AAGTTAGCAT 3420 

GTCTATCAAA TATCATTAAA TTACTTTTCC TTTTAAATAG CCAACAAATG ATGATACCCC 3480 

AAGTTTGGGT GGTATACTTA CTAACATATG GATATGATCT TTACATACCT CTGCTTCAAT 3540 
TATCTCTACA CCTTTTCTTT CATATAATTG ACGTAATATA ATCCCTATAT CTTTTTTTAT ~ 3600 

TTTTCCATAT ATCGCTTGTC TTCTGTATTT AGGTGCAAAG ACAATATGTT ACTTACAATT 3660 

20 CCATTTCGTA TGTGCTAAAC TGTTTGTGTC AGATGACATT AAATAGCATC TCCTCGTGTT 3720 

GATTATTTTG GTTGGCTGAC CAATATTTAC TCTAACATGT AGAGATGCAT TTTTTTGACA 3780 

ATGGTAGAAC CTTTTCTGGG GAGTGGGAGA GAAATGATAT TTTCGCAAAA TTTATTTCGC 3840 

25 CGTCCCACCC CAACTTGCAT TGTCTGTAGA AATTGGGAAT CCAATTTCTC TTTGTTGGGG 3900 
CCCCGCCCCA ACTCGCATTG CCTGTAGAAT TTCTTTTCGA AATTCTCTGT GTTGGGGCCC . 3 960 

CTGACTaGAA TTGAAAAAAG CTTaTTaCAA GCGCATT 3997 

30 

(2) INFORMATION FOR SEQ ID NO: 224: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1391 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION : SEQ ID NO: 224: 

GnGCGAGACA AACACACtTA TTGGTGCCAT TATmCcTAGA ATGaATTCaT ATGCAGTAGA 60 

TGAaaCAATC AAAGGATTGG CAAAACAATG CCAAAAATAT GAATCaCAAT TAATTTTAAA 120 

TTACACAGGT TTAAATATCG AAGCAGAAAT ACAAGCGCTT GAAACATTAG CACGCaGTAA 180 

AGTAGATGGT ATTGTTTTAA TGGCTACAGA CATAACAGAG AGACATATTG AAGTCATTAA 240 

TAAAATGAAT GTACCAATCG TTATTGTTGG TCAACAACAT GAACAACTTC ATAGTATTGT 300 

GCATGATGAT TATAAAGCAG GTCAAATTAT AGGCGAATGG ATTGGTCAAC AGGGATATCA 360 

ACAAGTTGAA GTGTTTAGTG "TAAGTGAAAA AGATATTGCA GTTGGTATAC ATAGAAAACG 420 



45 
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1080 




ACCCCAACGG 


ACTTATTTTT 
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■ 


ATAATCATTG 


GCAACGACAT 
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AGACGGTTnC 


1380 
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(2) INFORMATION FOR SEQ ID NO: 225: 

- (i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 930 base pairs 
3S (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

40 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 225: 

ATTTATTTTA ATGTTTATAT TTTCTAACAC TTTTTTATGA TCATAGTAGT AATTGACATT 60 
TTTCAATTCA AAGACTGGTG TCATCGTATc TCACCTCGCA TTCAACTATA CAACTCCTAG 120 

45 

TAACATATGT AAACAGTAAT GTTTACGACT CAAAATTAGA CAAAATAAAG AGATATGCCC 180 
CCTTCAAGTT TTATTTATCG CATTTCTTGA AGAGAGCATT ATCATTTTAT TGTTGCATAA 240 
CCTTATTTTT TAATTCTGGG TCAAATTGCT GTTGTTTTAA CATTTCAATT TCAAGTTTAT 300 

50 

ATGGCGGTTT TTTATTTTTC TTATCTTCAC CAACATAAGG TGTTTCTAAG ATTTTCGGAA 360 
TATCTTTAAA ACTATCATGA TGCACAATGT AATTTAATGC ATCAAAACCA ATGTAACCGA 420 
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GAACAACTTT GATTCTGTCG ACTCCAATGA TTTTATCAAA TTCATTTAAT ACGCCATCAA 540 

AGTCCTCTTT AACATTATAT CCAGCATCAT GCGTATGACA TGTATCAAAA CATACTGATA . 600 

AACGTTCGTT ATTATGAACT CCATCAATAA TACGTGCTAA CTCTTCAAAT GAGCGACCAA 660 

TCTCTGTACC TTTACCTGCC ATCGTTTCAA GCGCAATACG TACATTATTG TCATTCGTTA 720 

AAACTTCATT TAATCCTTCA ATAATCTTAT TAATTCCGGC ATCAACACCA GCTCCAACAT 780 

GCGCACCTGG ATGTAATACa ATATCTTTAG CCCCTATAGC TTGCGTTCTk TCaATTTCTT .84 0 

GTTGCAAGAA ATCTACACCA AGA1TAAACG TTTCTGGTTT GGTTGTAttG CAATaTTaAT 900 

GATGTATGGT GGCATGAACA ACAATATTAG 930 
(2) INFORMATION FOR SEQ ID NO: 226: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1984 base pairs 
20 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



25 - <xi) SEQUENCE DESCRIPTION: SEQ ID NO: 226: 

TGACG CACCA ATTTATAACG CAATTGACAA AACAATTAGA TATACCTGTG AAATTTGTAC 60 

CTGGAAACCA TGATTTATGG :GAAGTTGAAA GTATGACTAC ; GCAAGACATT ..TGGAATAATT 120 

ATAAGAGTAT GTCACAGTGC TTGGTAGGAA AAC CATTTAT AGTAAATGAA GAATGGGCAA 180 

TCATAGGACA TACTGGCTGG TATGATTATA GCTTTGCAGC ACAACGATTT TCATTAGATG 240 

AGTT ACAAAA AGGAAAACAT TATGGTGCGA CTTGGCAAGA TAAAGAACGA ATATCTTGGG 3 00 

GCATATCAGA TCAAAATTTA TCTAAAATAG CGGCTGAACA AGTGAAGAAA GATATATTAG 360 

AAGTAGGAAA TAGACGAGTG ATTTTAGTCA CACATGTTGT GACGCACCCT GATTTCATTG 420 

40 TTCCTATGCC GCATCGTATA TT CGATTTTT AT AATG CATT TATTGGGACA AGTGATTTCA 4 80 

ATCCTTTGTA TGCGATGTTC GATATACCAT ATAGTATTAT GGGCCATGTT CATTTTCGTA 54 0 

AAAGTGTGAT AGATGATGGC AGATGTTATC TCTGTCCGTG TCTAGGCTAT CCAAGACAAT 600 

GGCGTTCAGA AGATATTTAC CAGGAAATAA ATGAGACGAT ACAAATAATA GAAATTTAAA 660 

ATGCGCAAAC CTGACCCAGT TTG CGCATTT TATGTTTTAC ACACGCGAGT AATGTGTTTA 720 

CTTACGTGTG TTTATTTTGT TGCTGATTTT CAATTGTATA TGAATGTGGT TGCACATAAA 780 

TGCACTTTCT TCCTGGTGAA TTAAAGCTGT ATTCCATTTT CTCTTTACGA ATTTTAATAA 840 

TTTGTTTGCG ATTTGGAATG ATGGCAGGTA AAACTAGGCC ACGACGAATA TGACTCCAAA 900 
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TTGAAACTTG TTTCGCTGGC TTGTTATCAA AGCGGAAAAC ACGTAGTAAT GGTTTAGAAC 1020 

CAAGATTAGT ATGGTATATT AACACAGGTT GAGCTTGATC GATAATACCT TTAAGATCTT 1080 

CTAACGATTT ACCAGTGCCG TCTACGATAT TAGGATTGTA TTTTTGTAAA AATGGTACAT 1140 

ATGCTTCTGG AAATATCGTT TGATGATAAT TGCCAAGCTT AATGAATAAG TGATGTCCAA 1200 

CATAACCTTT ATGTGGATTG TTCGGATGTG TCGGCCAATG TCTCATAATT TCTGTAGCAG 1260 

GGATATGTTG GITGTTGTAT TGCAACATCA TGGCTGOGGA AACACCTTCA CACCCCATGA 1320 

CCATAGGGAT AGGAAATAGC TGACTGATAG GTTTAACTGG TAATATTTTT CGGTTCATAA 13 BO 

TATAGTCCTC GCATTGATTC AATAAATATT TAATATAATT ATATAGCGTC AATGCAAAAT 1440 

GTCCTAAACA TATGTTTTAC ATGAGTGAAT AAAATTAATG GAGTGATAAA ATGGAATATC 1500 

AATTACAACA ACTTGCGTCG TTAACGTTAG TAGGTATTAA AGAAACGTAT GAAAATGGAC 1560 

GACAGGCTCA GCAACATATA GCAGGGTTTT GGCAAAGATG TTATCAAGAG GGAGTAATTG 1620 

CGGATTTACA GTTAAAAAAT AATGGTGATT TAGCCGGGAT ACTTGGCTTA TGTATACCTG 1680 

AATTAGACGG TAAGATGTCA TATATGATTG CAGTTACCGG AGATAATAGT GCTGATATTG 174 0 

AAAAATATGA TGTCATAACA TTAGCAAGTT CAAAGTATAT GGTATTTGAA GCACAGGGCG 1800 G 

CAGTACCTAA AGCAGTTCAA CAAAAAATGG AAGAGGTTCA TCACTACATA CATCAATATC 1860 " 

AAGCAGATAC GGTAAAATCA GCACCATTTT TTGAGTTGTA TCAGGATGGT GATACTACAA 1920 * : 

GTGGAAAATT AATATTACCA GAAATTTGGG ATnCCTGTTA AAGGGGTGAT TGAAATAnGA 1980 

AllTG - : , - 1984 

(2) ^INFORMATION FOR SEQ ID NO: 227: * *- 



( i ) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 6373 base pairs 
- (B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
40 ' (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 227: 
45 GATTCCACGT GTGTTAAAAG AAGTTACAcC TTCAATGATG GTATTTACTA ATTTCTTTAG P 60 

AGATCAAATG GATCGCTTCG GTGAAATTGA TATTATGGTT AATAACATTG CAGAGACAAT . 120 
TAGTAATAAA GGCATCAAAT TATTGCTAAA TGCTGATGAT CCATTTGTGA GTCGTTTGAA 180 

50 

AATCGCAAGT GATACGATTG TGTACTATGG TATGAAAGCA CATGCCCATG AATTTGAACA 24 0 

AAGTACGATG AATGAAAGTA GATATTGTCC AAACTGTGGT CGCTTATTGC AATACGATTA 300 
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AAAATATGAA ATATCAAGTT TTGATGTGGC ACCGTTTTTA TATTTAAATA TCAATGATGA 


420 




AAAATATGAT 


ATGAAAATTG 


CAGGTGACTT 


TAACGCTTAT 


AACGCGTTAC AGCATATACT 


430 


5 


GTTTTAAGAG 


AGCTAGGGTT AAATGAACAA ACAATTAAAA ATGGCTTTGA AACGTATACA 


540 




TCAGACAATG GTCGTATGCA GTACTTTAAA AAAGAACGAA AAGAAGCGAT GATCAATTTA 


600 


10 


GCTAAAAATC 


CTGCAGGAAT 


GAATGCAAGT 


TTATCAGTTG 


GTGAACAATT AGAAGGCGAA 


660 


AAAGTGTATG 


TTATTTCGCT 


AAATGATAAC 


GCTGCAGATG GTCGAGATAC TTCATGGATT 


720 




TATGATGCAG ATTTTGAAAA ATTATCTAAG 


CAACAAATTG 


AAGCTATCAT CGTGACAGGT 


780 


15 


ACACGAGCAG AAGAACTTCA ATTGCGATTG AAGTTAGCAG AGGTTGAAGT AC CAATTAT A 


840 




GTTGAGCGTG ATATTTATAA AGCAACGGCA AAGACTATGG ATTATAAAGG TTTCACAGTT 


900 




GCAATACCAA ACTATACATC ATTAGCGCCT ATGCTTGAAC AATTAAACCG TTCGTTTGAA 


960 


20 


GGAGGTCAAT 


CATAATATGC 


ATGAATTGAC 


TATTTATCAT 


TTTATGTCAG ATAAATTGAA 


1020 




TTTATACAGT 


GATATAGGAA 


ATATTATTGC 


TTTAAGACAA 


CGTGCTAAAA AACGAAATAT 


1080 




TAAAGTTAAT 


GTCGTAGAAA 


TCAATGAAAC 


AGAAGGTATT 


ACCTTTGATG AATGTGATAT 


1140 


25 


TTTCTTTATC 


GGTGGTGGAA 


GTGATAGAGA 


ACAAGCATTA 


GCAACAAAAG AATTAAGTAA 


1200 




AATTAAGACA 


CCACTTAAAG 


AAGCGATTGA AGATGGTATG CGGGGATTAA ; CGATTTGTGG 


1260 


30 


AGGCTATCAA 


TTTTTAGGGA 


AAAAAT ATAT 


CACGCGTGAT 


GGTACAGAAT TAGAAGGGTT 


1320 


AGGTATTTTA 


GATTTTTATA 


CTGAATCAAA 


GACAAACCGA 


TTAACAGGAG ATATTGTTAT 


1380 




CGAAAGTGAT 


ACTTTTGGAA 


CTATTGTAGG. TTTTGAAAAT 


CACGGTGGTA GAACATATCA 


1440 


35 


TGATTT CGGT 


ACACTTGGTC 


ATGTTACTTT 


TGGTTATGGT AATAATGATG AAGATAAAAA 


1500 




AGAAGGCATT 


CATTATAAAA 


ATTTATTAGG 


TACTTATTTA 


CATGGACCAA TTTTACCTAA 


1560 




AAAfTACGAA atcactgatt atctgttaga 


AAAAGCTTGT 


GAACGTAAGG GTATTCCGTT 


1620 


40 


TGAGCCTAAA 


GAAATAGATA 


ATGAAGCGGA 


AATACAAGCG 


AAACAAGTAT TAATAGACAG 


1680 




AGCAAATAGA 


CAGAAGAAAT 


CTCGTTAACT 


CTGAACATCG 


CATCAATGGA TTTAATATTG 


1740 




ataaacgatg 


AAGTTTAGTA 


ATTAATCATA 


TATGTATAAA 


CACACACATT ATTTTGGATG 


1800 


45 


gaaacaacca 


AATTGATGTG 


TGTTTTrTTG 


TTCTAGTGAA 


TAATTATTAT ACAATGAGTA 


1860 




TCTATCCTAG 


AATTATCAAT 


AGTAATGGTG 


ATTATGCAAC 


ATGAAAAAAT GAATGATGAA 


1920 


50 


AGGAATTTGA 


CGATGAAGCC 


TACTAAAGTG 


ATATTAAAAG 


ATGCATCTTA TTTACATAGC 


1980 


AAAACATCGA 


TAACATTTAT 


TTTAAAAGAT 


GTAGTTATCG 


AAGAAGATAA TAAAATTTAT 


2040 




TATTTCGACA 


CTAGTGCAcT 


TTCGAAGATC AAGAAGTTAA ATTTGAATTT GCACTCTTTG 


2100 
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TTATAGAACC TGATTTACAT TTTACAATTA TTGATTTTAA TCAAGAACTG CTTTGTATTT 2220 

ATATTGATTT TGATTCTGGT TTAAGGCATT CAAACATGGC AACAGAATCT GGTATTTCAT 2280 

TAAGGATAAA TGTTGCTAAA TCAGATTTTA CTAAATTTAT TAATGAATTA GCCTCTTTAC 2340 

ATTAATGATT TAAATCTGAT ATGTAATTAC AATCAAAAAA GACAGCCACA TCCCTCCGTA 24 00 

GTTTAGGCGT GTGGCTATAT TTGAGTCTGA ATATTTATGC TTGTAATTTT AAAAAGGGAC 2460 
ATGCTATATA CGATAAAAAG AGGCGGGGAC ATAAATCAAT GTTCTATGCT CTACGAAGTT . 2520 

ATATTGGCAG TAGTTGACTG AACGAAAATG CGCTTGTAAC AAGCTTTTTT CAATTCTAGT 2580 

CAGGGGCCCC AACAAAGAGA AATTGGATTC CCAATTTCTA CAGACAATGC AAGTTGGGGT 2640 

15 

GTGGGCCCCA ACACAGAGAA TTTCGAAAAG AAATTCTACA GGCAAAGCGA GTTGGGGTGG 2700 

GACGACGAAA TAAATTTTAT GAAAATATCA TTTCTGTCCC ACTCCCATGG TOCCAATTAG 2760 

20 CATAAGGTAC TTAAATTAAG CATATCTGCT GTCTAGCAGT CGATAAATCA TTAGAACTTC 2820 

GTATAGTATA TGACTTTTAA TTTGATTTTC ACCACTAATT TCAAGTGCTT TTATAGTCGA 2880 

ACGTAAAGTT TCTACAGAAT CATCTTCTCT CTTAAAAGAA CCATCATAAA ATATATCTTT 2940 

25 GATGCTACTA CTAATTTTTA GCAATGCCAT TTTTTCGTCA CCTGAAAAGT TAACACGAGT 3 000 ? 

ATTTTTAGGC AAGTAAATGA TATTTGATAA ATGAGTGATA AACAAACGAT TCGTATATGC 306*0 

ACGTTTAGTT AATTGATTGA GTAATTTCCA ATCACATTCT TTTTTCTTAT GATAGCTTAA 3120 ~ 

TTCATCACGT TGATAACTTA TTAACGTTTC AACTTGATTA TTTAAATTGA AAATATTTTT 318 0 

ATATGCTTTT TCGCTTTTAT CAGATTGCAG TCTTGATAAG ATAAGTTCTT GGCAGCGATT 3240 

GTAAAATAAT TTATACATCA AGGCATCTGT CTTACTTAAT TTTTCTTCGA CGTGACCATA 3 300 * 

ATACTTAGGT GGAAACACCA TGAAGTTAAT TAAACCTGAT GTCACGAGTC CAATAATTGC 33 60 f " 

TGTCAATGTT CGAGACAAAA AGTTGAATAT GTAGGCATCA TGAATACCTG GAATCATAGC 3420 

40 TAATGATGTT AGTACAGCGA CATTCGTACC AACTTGCAAT TTGAGTTTTG TACAGAATAA 34 80 

AATCGTGAAC GTTGCACTCA ATGCATATGT AAAAGGTGAT TGATCGCCGA ATAAATATGT 3540 

AAATAATACT GCAAAGGCTG CACCAATTAC CGTAGCAGGT % AATCTACGAT AACCTTTAAT 3600 

45 -AAGTGATGCC TTGGCAGTTG GTTCAATTGT GACTACAGCT GTTAAAATGG CATAGATGGG 3660 

TGTTAAATCT AGTGCCATAC AAAAGACAGC TGTTAAAAAA ATGGCAATAC CAGTTTTAAT 3720 

TGTTCTGGCA CCAATTAAAT GTTTATACCA TTGATCGTTC ATTTTTTAAC CTCTAATCAT 3780 

SO 

CGTAAAATCT TAGCGAGCGC TTTATAATAA TAGTATCGTA CATTGGAAAA GTTCATGTAT 3 840 

GTAAAATATT TGAAATAATC ATACATAAGC ATTACTTTGA TTTTCATATA CATTAATCAA 3 900 
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CAAGCATTTT TCAATTATAG TCCGGGGCCC CAACATAGAG AATTTCAAAA AAGAAATTCT 4020 

ACAGGCAATG CAGGTTGGCG GGGCCCCAAC ACAGAAG CTG ACGAAAAGTC AGCTTACgAT 4080 

AATGTGCAGG TTGGCGGGGC CCCAACATAG AGAAATTGGA TCTACAATTT CTACAGGCAA 4140 

TGCAAGTTGG GGTACAACGA TAAAGAAATA TTTTTTCTTT ATCACACTAT GTCTCACTCA 4200 
CTTTCCAAAA TACTAAAGTA ACATCTTTAG TATATCAAAG AATTTTTGCT ATAATAAGTT - 4260 

ATAATTATAT AAAAAAGGAA CGGGATAAAA TGATTGTAAA AACAGAAGAA GAATTACAAG 4320 

CGTTAAAAGA AATTGGATAC ATATGCGCTA AAGTGCGCAA TACAATGCAA GCTGCAACCA 4380 

AACCAGGTAT CACTACGAAA GAGCTTGATA ATATTGCGAA AGAGTTATTT GAAGAATACG 4440 

GTGCTATTTC TGCGCCAATT CATGATGAAA ATTTTCCTGG TCAAACGTGT ATTAGTGTCA 4500 

ATGAAGAGGT GGCACATGGG ATTCCAAGTA AGCGTGTCAT TCGTGAAGGA GATTTAGTAA 4560 

ATATTGATGT ATCGGCTTTG AAGAATGGCT ATTATGCAGA TACAGGCATT TCATTTGTCG 4620 

TTGGAGAATC AGATGATCCA ATGAAACAAA AAGTATGTGA CGTAGCAACG ATGGCATTTG 4680 

AGAATGCAAT TGCAAAAGTA AAACCGGGTA CTAAGTTAAG TAACATTGGT AAAGCGGTGC 4740 

ATAAXACAGC TAGACAAAAT, GATTTGAAAG TCATTAAAAA CTTAACAGGT CATGGTGTTG 4800 

GTTTATCATT ACATGAAGCA CCAGCACATG TACTTAATTA CTTTGATCCA .AAAGACAAAA 4860 

CATTATTAAC TGAAGGTATG GTATTAGCTA TTGAACCGTT TATCTCATCA AATGCATCAT 4920 

TTGTTACAGA AGGTAAAAAT GAATGGGCTT TTGAAACGAG CGATAAAAGT TTTGTTGCTC 4980 

AAATTGAGCA TACGGTTATC GTGACTAAGG ATGGTCCGAT TTTAACGACA AAGATTGAAG 5040 

AAGAATAGTT CAACATATAC TAAGACTAAA GTATGAACAT CATTTAGTTC CGGAGCCTAT 5100 

- TCATATTGGT TTCGGAACTG TTTTATAATA ATTAAGAACA CAATCAATGG GTCATTTCAA 5160 

AAATATGTTG TAACAAAGTA GTTTTTAAGC AAACATATCA TCGACATGAA CGAAGATACA 5220 

40 TAGCGCATTT GGTATTTTAA AACTTATTAT AAAAGGTGAT AGTTATGAAC TATGTTGAAC 5280 

GTTATATTGA ACAGTTTTTG AGAGCAACAG TAAGAAATAA TATCAAGCAC TACCTTTTAA 5340 

TGCTAGATGA AAAAATGAAA AATTTAGATG ATTATATGCG TTATTTAATT ACTAAAAAAG 5400 

45 AACAACTTAG CAAGTTAATT GACAGTCTAA TGCTAACATT AGAAAATAAA TATATTGATA 5460 

TTGCTGAAGC ATTTCAAATT CAATGTGCAA GAGAAATCAA TAATCAAGAA ATTGAAAATA 5520 

TTAAATCAGA GTTGAATAAA GTTGAAGCAT ATTATGCACA AATTGAAACT CAAATTCAAC 5580 

SO 

AAACTTCAAC TGAAAAAATA GCAACAGAAA AAACATCGTA TCTAATAAAT TATATGAACG 564 0 

CTGTGGCATA GAAAGGCGGC GAAACATGAC ACACAAATAT ATATCAACGC AAATGTTGAT 5700 
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CTTTTTACTC GTTCTATTAT TGGGATGTGT ATTAGTTTAT GTAGGATATC TTTATTTTCA 582 0 

TAAAATACGT GGCCTTTTGG CGTTTTGGAT AGGCGCGCTA TTAATTGGAT TCACATTATT 5880 

GTCTAATAAG TATACAATGA TCATCTTGTT CGTCTTTTTA TTATTACTTA TTGTGCGTTA 594 0 

TTTAATACAC AAGTTTAAAC CAAAAAAAGT AGTTGCGACG GATGAGGTTA TGACTTCACC 6000 

ATCTTTTATT AAACAAAAGT GGTTTGGTGA GCAACGTACA CCAGTTTATG TATATAAGTG 6060 

GGAAGATGTA CAAATTCAAC ATGGAATTGG CGACCTACAT ATTGACTTAA CAAAAGCTGC 6120 

AAATATTAAG GAAAATAATA CCATTGTTGT TAGACACATT TTAGGTAAAG TGCAGGTTAT 6180 

ATTGCCGGTT AATTACAATA TTAATTTACA TGTAGCTGCT TTTTATGGAA GTACTTACGT 624 0 

GAATGAAAAA TCATATAAAG TTGAAAATAA CAATATTCAT ATTGAAGAAA TGATGAAACC 6300 

GGATAACTAT ACAGTTAATA TCTACGTATC AACGTTTATC GGAGACGTAG AGGTGATTyA 6360 

TCGATGAAyC ACT ' " 6373 
(2) INFORMATION FOR SEQ ID NO: 228: 

(i) SEQUENCE CHARACTERISTICS r 

(A) LENGTH: 44 88 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
^ - (d) TOPOLOGY: linear 



35 



40 



45 



50 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 228: 
ATAGnGAAAG CGTTTTACAC TTAATAACTC CCTCTTAAAT GCATCCAGGT TCTATGTAGT 
AAATCATGAA nATAACATAT AAATnTAGAG GAGATTTACC TTTGAATACA GAGAACAACA 
AGAATCAAAA CCAATCTGTT AAAAATTCTG AAAGaCGCGG CATGTTAAAA GGATGCGGCG 
GTTGCCTTAT TTCTTTTATT TTATTAATAA TCTTATTATC AGCCTGTTCA ATGATGTTTA 
GTAATAATGA CAATTCCACT AATAATCAAT CATCAAAAAC GCAATTAACT CAAAAAGATG 
AAAATAAAAA TGAAGATAAG CCTGAGGAAA AATCAGAAAC AGCAACAGAT GAGGATTTAC 
AATCAACCGA AGAAGTACCT GCAAATGAAA ATACTGAAAA TAATCAACAT GAAATTGATG 
AAATAACAAC AAAAGATCAA TCAGACGATG ATATTAACAC ACCAAACGTT GCAGAAGATA 
AATCACAAGA CGACTTGAAA GATGATTTAA AAGAAAAGCA ACAATCAAGT AACCATCATC 
AATCCACGCA ACCTAAGACC TCACCATCAA CTGAAACAAA CACGCAACAA TCATTTGCTA 
ATTGTAAGCA ACTTAGACAA GTATATCCGA ATGGTGTGAC TGCCGATCAT CCAGCATATC 
GACCACATTT AGATAGAGAT AAAGATAAAC GTGCATGTGA ACCTGATAAA TATTAAACAA 



60 



120 
180 



240 
300 
360 
420 
480 
540 
600 
660 
720 
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GGGAGATTTT TTAGGCATGA GCAATCAATT CAAAAGCGAA GAAGAGCGAA GACAATGGGA 840 

ACAATTCCAA GCTTTCCAAA ATCAACAAAA CCAACAGAAC CAGCAATACG GACAAAAGAA 900 

ATCTAAAAAA GGATGGTTCT GGGGCTGTGG TGGTTGTCTA GTATTATTTA TTTTAATTAT 960 

CATCGGTATT TCAGCTTGTA CAGCTGGTAT TACAGGTAAC CTTGGCGGAA ATAGTTCTAA 1020 

AGAAACGAAC AAAACCCATA AAATCGGTGa AACTGTTAAA AATGGCGACC TTGAAGTCAC 1080 

TGTAAATTCA GTGGAAACTA TGAAATCTGT AGGACCATCT CTTGCACCAA CAAACGCTAA 1140 

AGGTATATTT GTCGTTGCTG ATGTGACGAT TAAAAACAAA GGTAAAGAAG CGTTAACAAT 1200 

TGATAGTTCA ATGTTTAAGC TAAAATCCGG TGATAAAACA TTTGAAGCAG ATAATACAGG 1260 

TTCAATGTCT GCTAATCAAA GTGACAATGG TAGTATAGAA AATTCATTTT TCTTACAGCG 1320 

TATAAATCCA GATAGCACTG CTCAAGGTAA AATTGTTTcG ATGTGTCAGA AAACATAGCC 1380 
AACGCAAAaG ATAAAAAATT AGAAGTTATT TCTAGTTTAT TTAGCGTCAA GAAGATTACA r 1440 

TTTGATTTAT CCGATGCTAA AAAAAGATCA AAAGCTAAAA AAGACAAGCA AGATACAGAA 1500 

GTAGCTGTTG CGAGTTCAAA TAGCGATAAT GTAAGTTATG AAGCTTGGGC TACTACACCT 1560 

25 GCTACAACTT CTAGTGCGGA TACTGATTCT GAAGATAGCG AAAAGTCTAG TAAAGATGAG. 1620 

GATAAGGAGA ATGCGTCTAA AAgTGATAAA TCTAGTGTAG AAAAAAGTGA , ATCTAATGAG 1680 

GAAACTGCTC - CTGTAGAGCC CATGCCCCAT AGCAAACCTA CCACTAGTGA aGCACCACCT 1740 

30 AGCCAAAATA TTCACAaTGa AGATAGCmTG TACGACGCTT CAACAGAATA AAATtnyCAG 1800 

tAGCTCGGCT ACCCTTCTTT TACGGAAAAA TTAATTATAC ATAATCaAAT ■ CaAGGAGATA .1860 

AAAAAATGAA ATTCAAAGCT ATCGTTGCAA TCACATTATC aTTGTCACTA TTAACTGCCT 1920 

GTGGTGCTAA TCAACATAAA GAAAATAGTA GTAAATCAAA TGACACTAAT AAAAAGACGC 1980 

AACAAACTGA CAACACTACA CAGTCAAATA CAGAAAAGCA AATGACACCA CAAGAAGCCG 2040 

40 AAGATATAGT TCGAAACGAT TACAAAGCAA GAGGCGTTAA TGAATATCAA ACATTAAATT 2100 

ATAAAACAAA TCTTGAACGA AGCAATGAAC ATGAATATTA TGTTGAACAT CTAGTCCGCG 2160 

ATGCAGTTGG CACACGATTA AAACGTTGTG CTATTGTTAA TCGACACAAT. GGCACAATTA 2220 

45 TTAATATTTT TGATGATATG TCAGAAAAAG ACAAAGAAGA ATTTGAAGCA TTTAAAAAGA 2280 

GAAGCCCTAA ATACAATCCA GGTATGAACA ATCATGATGA AACAGATGGT GAGTCAGAAG 2340 

ACATTCAACA TCATGACATT GATAATAACA AAGCAATTCA AAATGACATA CCAGATCAAA 2400 

AAGTCGACGA TAAAAATGAT AAAAATGCTG TTAATAAAGA AGAAAAACAT GATAATGGGG 2460 

CAAATAATTC TGAAGAAACT AAAGTTAAAT AATGGCATAC TTTGATTAAT CGTAATTTTT 2520 
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ACTATGCATG GTCTTTTTAA TCAACTTAAA CTCGGCATTA TTTCAATCGA AAACGCAGAG 2640 

CATACGCTTT TTACACCTTA TATGTTGGAA ACGCTCTCTT CCCTAGGCGT GAAAGACAGC 2700 

ATTGTCGATT TAATTCATAA AGGGACTGAA TTAGAAGACT TTGCGGCATT TAATTTATCA 2760 

ATTGAAGACA CAGTTACAGT CTGTTTACAA AGAACTGAAG AACTATTAAA ACAATACAAA 2820 

AATGTGGAAT TCAATGACAA AATATTAATC AATTGGCGTA TTATACAAGA GAAATAGACA 2880 

TATAAAAGTC GAATGTAACt ACGTGAGTAT TGATTTTATT CTTTGTAAAT TACAAGCATT 2940 

TCATATTATA AAGTTTGAAA AGAGGTATAT TGAAATGGAG AAAAATGAAT ATATAGCTAA 3000 

ATATAATGAA TATAGTCAAT TATTAGACGC TACATACTCG CAAGCTGTAG CATmCCTTTT 3060 

AAGtAAATaT GGCGCTGTAA CCGATGATTA TTATAAAGaA AAATCATACA CGCGATTTTT 3120 

AAAtGGAGnA ATCAAAAGTA TTTCAAAAGG AAAATACACT AGAGCTAGCG AaGGATTATA 3180 

TTGCCATCAT ATAAGCGAGG ACAAATTCCA AAATCTATCT GATCTAAGAT TCATtTCCAA 3240 

. ATTTAAGTAC TCATACGACG TTCAAAAGAA AGAAAACTTA GTGTACTGTG ATCTAATCGA 3300 

GCATTTAATT TTACATGCAA TTATTACAAA AGAATCCCAT GGCCAATTTG GTGTAGCTGG 3360 

ATTATGTCAA ATGATCAAAC CAACAGTCAT TGATTGGTAC ATTGGCGAAT ATAATCCAAA 3420 

ACCAGCATGG ATGCAAGCCA CCAAAGCACG TGCCTATTTG CCTGGAATAT TAGTAGAGAA 34 80 

ATTACTCAtT AAAATTGACG ATATGTTAAA AGGAATAGAA ATATAAGATT TCCTTGAGTC 3540 

TAGATAAATG ATTAATGTAG ATTTATTTTT TGCTGTTGAG ATTTTGTTAT AGATGTTTAA 3600 

ACCTGTAATT AAATATATTT TATAAAATAG ACCACGCATA CCTATCTATA AACGGrCAAT 3660 

GTTTATAAAT GAGTTTGCAT GGtCTTGAAT TGTATTAAAT TTCTTTTGGT TTTAATAAAT 3720 

CGACTAGATT TTCACAATAT TTATCAAATA TGTATTCCTA AATTATACAG CCTTAATCCA 378 0 

GCACJCTACTT TCGAAACTTC CAACTTAGTT GATATAAGGT TCAATAGTTT GTTTCGTTCT 3 840 

TTTTCAGATA AACCAGAACT TAAATTGATA TTATTGACTT CATAAAAATT ATAGACTAAT 3900 

GCCTCTATTT GCTTTTTAGG CATAAGTAAG TCGACTGAAA ACTGATTTAC GTCGCTTTCA 3 960 

TAAATCATTT CATGTAAATT CTTTAGACTA TTATCGTTAC TATCTCTCAT TAAGTCTGTA 4020 

TTTTTAAATA AATAACGGCC CAATTCACGA GCTATTGAAA ATCTTGTATT ATTAATCGAG 4080 

TGATTATTAT TAATATAGAT TGTTCTTCCA CTTAAATAAC CCGAAGTATT ACCCTCCATT 4140 

TTAATATATC TAACATTTAA ATTAAGTTGA AATAATAGCT TGTCTATGTC AATAGCAAAG 4200 

TGTTCAGAAG TAATAAAAAG TTGATCCATT TTGTCCTTTA TAAATGCCTG AAATAATCGA 4260 

ACTATTTTTG ATTCTAAAAT ATCTTCATAA TGAACTTTCT CAATAACTTT CAATTGATTC 4320 
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AACATTATTA AAATAAAACC CCTCTACTAC TATATGTAAC GAAGGGACAT GATTTCAAAA 4440 
TAAAATACCT TTTTTATAAA TnTATTATAA TATCCCCCAC TATACnAC 4488. 
5 (2) INFORMATION FOR SEQ ID NO: 229: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 846 base pairs 

(B) TYPE:- nucleic, acid 

10 (C) STRANDEDNESS: double 

(D) TOPOLOGY : linear- 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 229: 





TATGGCGCCA 


TATTAGTTGT 


AACTGGTTTA 


AGAGGTCcAa 


GAAaTATCaA 


ATAAAGTTGT 


60 




tCCTGGGCTT 


GGTACTGTTA 


TCTCaATATT 


GmwTGCaTTT 


GGTGGTCTAG 


CTTTTAATAT 


120 


20 


TGGTAATATT 


GCTGGTGCCG 


GTTTAGGTTT 


AAATGCAATT 


TTTGGATTAG 


ATGTAAAATG 


180 




GGGCGCAGCT 


ATTACTGCAA 


TCTTTGCAAT 


ATTAATCTTT 


GTAAGTAAAA 


GTGGCCAAAA 


240 




AATTATGGAC 


GTTGTTTCAA 


TGATTCTTGG 


TATTGTGATG 


ATTTTAGTTG 


TGGCATATGT 


300 


25 


GATGTTTGTT 


TCTAATCCAC 


CTTATGGTGA 


TGCTTTTGTG 


CATACATTTG 


CGCCAGAACA 


360 




TCCAATGAAA 


TTAGTCTTGC 


CCATCATTAC 


GTTAGTTGGT 


GGAAcTGTar 


GTGGTTATAT 


420; 


30 


TACCTTTGCA 


GGTGCACATC 


GTATATTAGA 


CTCTGGCATT 


AAAGGTAAGC 


AATATTTACC 


480 


ATTTGTAAAT 


CAATCAGCAA 


TTGCTGGTAT 


TTTAACTACA 


GGTATTATGA 


GAACGTTACT 


54 0 




ATTCCTAGCG 


GTATTAGGAG 


TTGTTGTAAC 


AGGTGTGACA 


CTAAGTTCTG 


AAAATCCACC 


600 


35 


AGCGTCAGTT 


TTTGAACACG 


CAATTGGACC 


AATTGGAAAG 


AATATTTTTG 


GTATTGTGTT 


660 




ATTTGCTGCA 


GCTATGTCAT 


CAGT AATTGG 


CTCAGCATAC ACAAGCGCAA CATTTTTAAA 


720 




AACACTTCAT 


AAATCACTTA 


ACGAAAGAAG 


TAATTTAATT 


GTGATTGTGT 


TTATCGTTAT 


780 


40 


TTCAACAATG 


ATTTTCTTAT 


TTATTGGAAA 


ACCAATCAGC 


CTTTTAATTA 


TAGCAGGCGC 


840 



GATAAA 846 
(2) INFORMATION FOR SEQ ID NO: 230: 

45 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2072 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
50 . 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO : 230 : 

55 



999 



